
Portail numérique
Il mesure près de un mètre soixante-dix de long, est équipé d'une caméra numérique mobile et d'un système d'éclairage embarqué qui ne dégage aucune chaleur, sans compter les logiciels très sophistiqués qui l'accompagnent. Tel est le scanner expert utilisé par les « Bibliothèques virtuelles humanistes » (BVH) pour numériser les livres anciens, souvent rares et précieux.
Le projet BVH a été lancé en 2003 par le Centre d'études supérieures de la Renaissance (CESR)1, avec la collaboration de la section Humanisme de l'Institut de recherche et d'histoire des textes (IRHT) du CNRS, pour mettre les ouvrages de la Renaissance (XVe-XVIIe siècles) à la disposition des chercheurs et d'un plus large public sur un site dédié2. Il présente déjà quelque 200 ouvrages en mode image (pages en fac-similé) sur un total de 2 000 prévus, et certains également en mode texte (transcription en Word), chacun accompagné d'outils ergonomiques et d'une notice bibliographique. Il s'agit des grands classiques de la Renaissance et de documents moins connus mais d'un grand intérêt scientifique pour les spécialistes. Les BVH travaillent en étroite collaboration avec les bibliothèques de la région Centre, berceau de la Renaissance en France, avec la Bibliothèque nationale de France (BNF) et d'autres bibliothèques (Paris, Poitiers, Lyon, Troyes…). Le projet est également accessible sur Gallica, la bibliothèque numérique de la BNF.
« Mais les BVH sont bien plus qu'une simple bibliothèque en ligne, explique Sébastien Busson, ingénieur d'études CNRS responsable des opérations techniques (numérisation, traitements logiciels, architecture du site). Elles proposent également aux chercheurs de précieux outils d'analyse grâce à l'utilisation de logiciels spécifiques. » Ces derniers sont développés avec la collaboration de Jean-Yves Ramel, du Laboratoire d'informatique de l'université de Tours.
© S. Busson/CESR Au total, 2 000 livres anciens de la Renaissance vont être numérisés. Des logiciels très sophistiqués (Agora ci-dessus) permettent aussi d'analyser ces textes.
Enfin, un autre logiciel de reconnaissance de caractères anciens, « Reconnaissance et transcription assistée par ordinateur » (Retro), est en cours de développement. Il permettra de transcrire les textes imprimés avec des caractères anciens que les logiciels d'OCR ne reconnaissent pas correctement aujourd'hui. Retro augmentera la cadence de transcription des documents et contribuera à la constitution d'une Bibliothèque numérique européenne4, qui devrait proposer, en mode texte et image, les patrimoines documentaires de tous les temps.
Bruno de la Perrière
1. Centre CNRS / Université Tours.
2. www.bvh.univ-tours.fr
3. Logiciels dits d'OCR, pour optical character recognition.
4. Europeana : www.europeana.eu
Sébastien Busson
Centre d'études supérieures de la Renaissance (CESR), Tours
sebastien.busson@univ-tours.fr