Moteur de recherche

 

Retour au sommaire

Informatique

Les grands auteurs à portée de clic

Souris en main et textes à l'écran, explorer à sa guise les textes des grands auteurs… Quel lycéen n'en a-t-il pas rêvé pour préparer le « bac » ? C'est chose faite avec Lytext (Lycée + textes), un outil informatique développé par des chercheurs et testé actuellement dans une trentaine de lycées lorrains. En deux clics, il analyse la structure du texte, identifie les rimes, définit les mots ou encore repère les figures de style. De quoi donner toutes les clés pour construire une analyse de texte en bonne et due forme.
Cinq années de recherches ont été nécessaires au laboratoire « Analyse et traitement informatique de la langue française » (Atilf)1, à qui l'on doit déjà le Trésor de la langue française informatisé2, monumental dictionnaire accessible à tous via le Centre national de ressources textuelles et lexicales3. Mais rien ne prédisposait ce laboratoire à mettre ses ressources au service de l'enseignement. « Le point de départ fut une demande de la Région Lorraine, qui, à la recherche de contenu pour sa plateforme e-Lorraine, a soutenu financièrement le projet, explique Jean-Marie Pierrel, directeur de l'Atilf. Nous avons aussitôt accepté. Nous avons commencé par travailler sur les définitions. Le problème majeur a alors été de pouvoir, en fonction du contexte de l'œuvre, sélectionner les seules définitions utiles au lycéen. » Car les dictionnaires proposent pour chaque mot ou presque de notre langue moult définitions. Comment savoir par exemple que le mot « fétiche » employé par Voltaire dans Candide désignait une personne à laquelle on voue un respect exagéré ? Tel fut donc l'objet de la thèse de Claire Becker, au sein d'Atilf. En concertation étroite avec un groupe d'enseignants soutenu par l'académie de Nancy-Metz, la chercheuse a d'abord abouti à un prototypage « fait à la main » sur quelques textes. Étape suivante : automatiser l'analyse linguistique inhérente au tri des définitions. « Notre algorithme devait faire émerger les mots ambigus puis sélectionner en fonction du contexte la bonne définition », précise Jean-Marie Pierrel. Résultat quasi parfait : aujourd'hui, Lytext lève l'ambiguïté pour 95 % des mots considérés comme difficiles par les enseignants. Quant aux 5 % restants, ils recouvrent des mots surtout liés au contexte social de l'époque… Mais c'est ici l'affaire des sociolinguistes.
Reste encore quelques points à automatiser, concernant la détection des figures de style ou bien celle des allitérations. Subtile, donc ardue. Et pour ce faire, « nous comptons sur la recherche fondamentale », conclut Jean-Marie Pierrel dans un sourire. À suivre, donc.

Patricia Chairopoulos

Notes :

1. Laboratoire CNRS / Universités Nancy-I et II / Université Metz – www.atilf.fr
2. Consulter le site web
3. Créé en 2005 par le CNRS, www.cnrtl.fr.

Contact

Jean-Marie Pierrel
Laboratoire « Analyse et traitement informatique de la Langue française » (Atilf), Nancy
jean-marie.pierrel@atilf.fr


Haut de page

Retour à l'accueilContactcreditsCom'Pratique