Moteur de recherche

 

Retour au sommaire

Portail numérique

La Renaissance à livre ouvert

Ce seront à terme 2 000 ouvrages de la Renaissance que proposeront les « bibliothèques virtuelles humanistes » aux chercheurs et à tous les autres publics. Ils seront par ailleurs accompagnés de précieux outils numériques d'analyse de ces textes.

Il mesure près de un mètre soixante-dix de long, est équipé d'une caméra numérique mobile et d'un système d'éclairage embarqué qui ne dégage aucune chaleur, sans compter les logiciels très sophistiqués qui l'accompagnent. Tel est le scanner expert utilisé par les « Bibliothèques virtuelles humanistes » (BVH) pour numériser les livres anciens, souvent rares et précieux.

Le projet BVH a été lancé en 2003 par le Centre d'études supérieures de la Renaissance (CESR)1, avec la collaboration de la section Humanisme de l'Institut de recherche et d'histoire des textes (IRHT) du CNRS, pour mettre les ouvrages de la Renaissance (XVe-XVIIe siècles) à la disposition des chercheurs et d'un plus large public sur un site dédié2. Il présente déjà quelque 200 ouvrages en mode image (pages en fac-similé) sur un total de 2 000 prévus, et certains également en mode texte (transcription en Word), chacun accompagné d'outils ergonomiques et d'une notice bibliographique. Il s'agit des grands classiques de la Renaissance et de documents moins connus mais d'un grand intérêt scientifique pour les spécialistes. Les BVH travaillent en étroite collaboration avec les bibliothèques de la région Centre, berceau de la Renaissance en France, avec la Bibliothèque nationale de France (BNF) et d'autres bibliothèques (Paris, Poitiers, Lyon, Troyes…). Le projet est également accessible sur Gallica, la bibliothèque numérique de la BNF.

« Mais les BVH sont bien plus qu'une simple bibliothèque en ligne, explique Sébastien Busson, ingénieur d'études CNRS responsable des opérations techniques (numérisation, traitements logiciels, architecture du site). Elles proposent également aux chercheurs de précieux outils d'analyse grâce à l'utilisation de logiciels spécifiques. » Ces derniers sont développés avec la collaboration de Jean-Yves Ramel, du Laboratoire d'informatique de l'université de Tours.

agora

© S. Busson/CESR

Au total, 2 000 livres anciens de la Renaissance vont être numérisés. Des logiciels très sophistiqués (Agora ci-dessus) permettent aussi d'analyser ces textes.


Le logiciel « Analyseur graphique pour ouvrages anciens » (Agora) permet l'extraction automatique des éléments constitutifs des pages : bloc de texte, titre, numéro de page, éléments graphiques (lettrines, bandeaux ou illustrations). Ces éléments sont indexés dans des bases de données. « Les documents anciens possèdent de nombreuses particularités qui ne permettent pas d'appliquer les techniques classiques de reconnaissance des caractères3. Ils sont quelquefois endommagés et leur facture, avec les presses manuelles, est différente de celle des livres modernes. La chaîne de numérisation doit respecter ces particularités », explique Sébastien Busson. Par exemple, les images de lettrines, extraites avec Agora et classées par un logiciel de comparaison de formes, peuvent être utilisées pour identifier les matériels des livres imprimés sans nom d'imprimeur ou sans date d'impression et ainsi en déterminer l'imprimeur ou la date.

Enfin, un autre logiciel de reconnaissance de caractères anciens, « Reconnaissance et transcription assistée par ordinateur » (Retro), est en cours de développement. Il permettra de transcrire les textes imprimés avec des caractères anciens que les logiciels d'OCR ne reconnaissent pas correctement aujourd'hui. Retro augmentera la cadence de transcription des documents et contribuera à la constitution d'une Bibliothèque numérique européenne4, qui devrait proposer, en mode texte et image, les patrimoines documentaires de tous les temps.

 

Bruno de la Perrière

Notes :

1. Centre CNRS / Université Tours.
2. www.bvh.univ-tours.fr
3. Logiciels dits d'OCR, pour optical character recognition.
4. Europeana : www.europeana.eu

Contact

Sébastien Busson
Centre d'études supérieures de la Renaissance (CESR), Tours
sebastien.busson@univ-tours.fr


Haut de page

Retour à l'accueilContactcreditsCom'Pratique