Abstract : In this article, a first approach of non-normed school corpora treatment by using methods from NLPwill be exposed. Specific features of this type of texts will be shown by presenting the corpus and first hypothesis to achieve its annotation in term of errors. Main goals of this work will also be
presented.
Résumé : Dans cet article est présentée une première approche de l’usage de méthodes issues du TAL pour exploiter des textes scolaires, très peu normés. Il permettra d’envisager la spécificité de ces écrits à travers la présentation du corpus étudié avant de se pencher sur les premières hypothèses de
traitement automatique en vue d’une annotation des erreurs qui le composent. Y seront également exposés les objectifs de ce travail et la portée attendue