Pistes pour le contrôle d'un robot parlant capable de réduction vocalique - Université Grenoble Alpes Accéder directement au contenu
Thèse Année : 1996

Proposals for the control of a speaking robot capable of vowel reduction

Pistes pour le contrôle d'un robot parlant capable de réduction vocalique

Résumé

The purpose of this thesis is to study how the phonemic command, abstract and invariant in nature, is coded in terms of motor control, to generate a physical and variable acoustic signal. A motor control model is exploited, based on the Equilibrium Point hypothesis, proposed by A. Feldman, which suggests that movement results from shifts in variables controlling the system’s mechanical equilibrium. The hypothesis studied here consists in relating discrete motor commands, specifying target equilibrium points, to phonemes. Realistic articulatory and acoustic trajectories were generated with this model for Vowel-Vowel-Vowel sequences, uttered by a French speaker, under several speech conditions. Articulatory trajectories were inferred from the acoustic signal by a first inversion involving an articulatory model of the vocal tract. A functional dynamic model of speech articulators, applied to the tongue body articulator, which is considered as the most relevant in the studied sequences, is then inverted to recover the motor commands underlying the trajectory observed in the “ideal” speech condition. Then from the motor commands thus inferred for the ideal condition, articulatory and acoustic signals, similar to the ones observed in other conditions, are generated by simply tuning appropriate dynamic parameters. A new track is thus open for adaptive speech synthesis. Sensitivity analysis and perceptual tests on synthetic signals attest for the model’s ability to simulate focus stress and rate effects using constant postural (equilibrium point) commands.
L’objectif de cette thèse est d’étudier comment la commande phonémique, par essence abstraite et invariante, est codée en termes de contrôle moteur pour générer un signal acoustique physique et hautement variable. Pour cela, un modèle de contrôle moteur est exploité, s’appuyant sur la théorie « du Point d’Equilibre », proposée par A. Feldman, selon laquelle tout mouvement résulterait de modifications des variables de contrôle des conditions d’équilibre mécanique du système moteur. L’hypothèse étudiée ici consiste à relier les commandes motrices discrètes, spécifiant des points d’équilibre cibles, aux phonèmes. Ce modèle permet de générer des trajectoires articulatoires et acoustiques réalistes, pour des séquences Voyelle-Voyelle-Voyelle, prononcées par un locuteur français dans diverses conditions d’élocution. En effet, partant du signal acoustique produit par le locuteur, une première étape d’inversion d’un modèle articulatoire du conduit vocal fournit les trajectoires des articulateurs du conduit vocal. Puis, pour l’articulateur corps de la langue, le plus pertinent dans les séquences vocaliques étudiées, un modèle dynamique fonctionnel des articulateurs de la parole est inversé (deuxième étape d’inversion), afin de trouver les commandes motrices sous-jacentes à la trajectoire observée dans une des conditions d’élocution, dite idéale. Puis à partir des commandes motrices ainsi inférées pour la condition idéale, il est possible, en ne faisant varier que les paramètres dynamiques appropriés, de générer des signaux articulatoires et acoustiques variables, similaires à ceux des autres conditions d’élocution. Ainsi une piste nouvelle pour la synthèse adaptative de la parole est ouverte. Des analyses de sensibilité et des tests perceptifs effectués sur les signaux de synthèse attestent de la capacité de ce modèle de contrôle à simuler les effets d’accent d’emphase et de débit à partir de commandes posturales constantes du type « Point d’Equilibre ».
Fichier principal
Vignette du fichier
Loevenbruck_These_1996.pdf (39.6 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-02293306 , version 1 (20-09-2019)

Identifiants

  • HAL Id : tel-02293306 , version 1

Citer

Hélène Loevenbruck. Pistes pour le contrôle d'un robot parlant capable de réduction vocalique. Linguistique. Institut National Polytechnique Grenoble (INPG), 1996. Français. ⟨NNT : ⟩. ⟨tel-02293306⟩
136 Consultations
28 Téléchargements

Partager

Gmail Facebook X LinkedIn More