Chapitre IV.2 - Analyse et génération de textes scientifiques ou littéraires : exemples d’applications
Résumé
Ce chapitre porte sur plusieurs liens entre l’information et le langage naturel. On distingue généralement le langage « naturel », qui est celui utilisé par les humains pour communiquer (par exemple, le texte de ce chapitre), des langages fortement normalisés qui sont, eux, utilisés pour traiter l’information avec des machines. Les documents écris en langage naturel constituent des données d’un type très particulier, qui nécessite la mise en oeuvre de techniques spécifiques pour les manipuler et les interroger.
Les travaux présentés ici relatent des recherches dont la problématique est d’extraire des informations du texte ou de générer du texte à partir d’informations structurées. Il aborde ces problématiques au travers d’exemples variés comme l’étude des textes littéraires ou le traitement automatique des textes scientifiques. Ces derniers sont aujourd’hui largement accessibles sur le Web au travers de très grandes Bases de Données documentaires spécialisées qui font l’objet d’un commerce important.