Aligner production et normalisation : une première approche pour l’étude d’écrits scolaires - Université Grenoble Alpes
Communication Dans Un Congrès Année : 2017

Aligner production et normalisation : une première approche pour l’étude d’écrits scolaires

Claire Wolfarth

Résumé

The emergence of school corpora and the will to provide tools for such specific corpora bring to light new research issues for natural language processing (NLP). We will expose a research which aims at correcting early learners’ written production with the purpose of annotating and exploiting it at a later stage. We are putting forward to consider this stage as an alignment task between the learners’ written and a manually produced ‘normalized version’ of it. This method increases significantly lemmas and forms identification task results and improves annotation possibilities
L’émergence des corpus scolaires et la volonté d’outiller ces corpus spécifiques font apparaitre de nouvelles problématiques de recherche pour le traitement automatique des langues (TAL). Nous exposons ici une recherche qui vise le traitement de productions d’apprenants en début d’apprentissage de l’écriture, en vue d’une annotation et d’une exploitation ultérieure. À cette fin, nous proposons d’envisager cette étape comme une tâche d’alignement entre la production de l’apprenant et une normalisation produite manuellement. Ce procédé permet d’augmenter significativement les scores d’identification des formes et lemmes produits et améliore les perspectives d’annotation.
Fichier principal
Vignette du fichier
Wolfarth_RECITAL_2017_corrigé.pdf (872.35 Ko) Télécharger le fichier
Aligner production et normalisation.pdf (3.08 Mo) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01940725 , version 1 (11-12-2018)

Identifiants

  • HAL Id : hal-01940725 , version 1

Citer

Claire Wolfarth. Aligner production et normalisation : une première approche pour l’étude d’écrits scolaires. TALN-RECITAL 2017, Jun 2017, Orléans, France. pp.56-69. ⟨hal-01940725⟩

Collections

UGA
31 Consultations
45 Téléchargements

Partager

More