Chapitre III.4 - Données et connaissances pour le son et la parole
Résumé
Ce chapitre retrace un courant de recherche sur la reconnaissance de la parole des années 1980, courant dit « analytique », qui consistait à analyser finement la structure de la parole pour en dégager les éléments de base,
les phonèmes et leur organisation syntagmatique, au plan phonologique (c’est-à‑dire leurs relations à courte et longue portée). C’était également l’époque des Systèmes Experts en IA où l’on pensait que les experts phonéticiens en lecture de sonagrammes fourniraient des règles utiles pour le décodage acoustico-phonétique
(opération qui consiste à passer du signal ou de sa représentation temps-fréquence - le sonagramme – à la chaîne phonétique correspondante). En effet, les phonéticiens savent parfaitement décrire les phonèmes en termes d’indices acoustiques et de traits phonologiques et il semble possible de « décoder » le signal de parole comme l’aurait fait un expert humain, en repérant d’abord des indices caractéristiques, puis, par un raisonnement de type abductif, à replacer les éléments dans un tout, ce tout étant la chaîne phonétique finale.
Pour cela, il faut accumuler des connaissances et préalablement constituer des Bases de Données de sons, ce qui est le sujet de ce chapitre qui nous replace dans le contexte de cette époque où il y avait précisément à Grenoble des équipes à l’IMAG en BD et à l’ICP (Institut de la Communication Parlée) en parole. De leur côté, les BD (Bases de Données) et les BC (Bases de Connaissances) avaient acquis une maturité qui permettait de les appliquer pour des tâches complexes telles que l’extraction de connaissances une fois que les données sonores seraient correctement et efficacement représentées et caractérisées. À partir d’une certaine quantité de données, on pensait que toutes les combinaisons phonétiques seraient suffisamment représentées pour en tirer des régularités intéressantes et les mettre sous forme de règles en vue de la reconnaissance automatique de la parole. Menés conjointement par l’ICP (Jean Caelen et Jean-François Sérignat) et l’IMAG (Michel Adiba) les travaux décrits ici correspondent principalement aux thèses d’Ofélia Cervantes et de Yolanda Fernandez.