Extraction et représentation des constructions à verbe support en espagnol - Université Grenoble Alpes Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Extraction and representation of support verb constructions in Spanish

Extracción y representación de construcciones con verbos de apoyo en español

Extraction et représentation des constructions à verbe support en espagnol

Résumé

The computational treatment of support verb constructions (take a picture, make a presentation) is a challenging task in NLP. This is also true in Spanish, where these constructions are frequent in texts, but not frequently included in machine-readable lexicons. Our goal is to extract support verb constructions from a very large corpus of Spanish. We fine-tune a set of morpho-syntactic patterns based on a large set of possible support verbs. Then, we filter this list using thresholds and association measures. While quite standard, this methodology allows the extraction of many good-quality expressions. As future work, we would like to investigate semantic representations for these constructions in multilingual lexicons.
Le traitement informatique de constructions à verbe support (prendre une photo, faire une présentation) est une tâche difficile en TAL. Cela est également vrai en espagnol, où ces constructions sont fréquentes dans les textes, mais ne font pas souvent partie des lexiques exploitables par une machine. Notre objectif est d'extraire des constructions à verbe support à partir d'un très grand corpus de l'espagnol. Nous peaufinons un ensemble de motifs morpho-syntaxiques fondés sur un grand nombre de verbe support possibles. Ensuite, nous filtrons cette liste en utilisant des seuils et des mesures d'association. Bien que tout à fait classique, cette méthode permet l'extraction de nombreuses expressions de bonne qualité. À l'avenir, nous souhaitons étudier les représentations sémantiques de ces constructions dans des lexiques multilingues.
Fichier principal
Vignette du fichier
CastellanosTALN14.pdf (360.63 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01376578 , version 1 (06-10-2016)

Identifiants

  • HAL Id : hal-01376578 , version 1

Citer

Sandra Castellanos-Paez. Extraction et représentation des constructions à verbe support en espagnol. 21ème conférence sur le Traitement Automatique des Langues Naturelles (TALN-RECITAL 2014), Jul 2014, Marseille, France. pp.419-424. ⟨hal-01376578⟩
73 Consultations
152 Téléchargements

Partager

Gmail Facebook X LinkedIn More