ISBN-13: 9786131504204 / Francuski / Miękka / 2018 / 212 str.
L'extraction d'information a partir de textes specialises exige l'application d'un processus complet de fouille de textes. Une des etapes de ce processus consiste a extraire les termes dans les textes. Les termes sont definis comme des groupes de mots representant des traces linguistiques de concepts. La tache d'acquisition de la terminologie consiste, dans un premier temps, a extraire les mots voisins verifiant des patrons syntaxiques simples. Une des specificites de notre algorithme est son aspect iteratif utilise pour construire des termes complexes. Par ailleurs de nombreux parametres ont ete ajoutes au systeme EXIT (EXtraction Iterative de la Terminologie). Un des parametres permet d'utiliser differents criteres statistiques pour classer les termes selon leur pertinence par rapport a une tache a realiser. De plus, notons qu'avec EXIT l'expert est place au centre du processus. Notre approche a ete validee a partir de quatre corpus de langues, de tailles et de domaines de specialite differents. Enfin, une methode fondee sur un processus d'apprentissage supervise est proposee afin d'ameliorer la qualite de la terminologie extraite.
Lextraction dinformation à partir de textes spécialisés exige lapplication dun processus complet de fouille de textes. Une des étapes de ce processus consiste à extraire les termes dans les textes. Les termes sont définis comme des groupes de mots représentant des traces linguistiques de concepts. La tâche dacquisition de la terminologie consiste, dans un premier temps, à extraire les mots voisins vérifiant des patrons syntaxiques simples. Une des spécificités de notre algorithme est son aspect itératif utilisé pour construire des termes complexes. Par ailleurs de nombreux paramètres ont été ajoutés au système EXIT (EXtraction Itérative de la Terminologie). Un des paramètres permet dutiliser différents critères statistiques pour classer les termes selon leur pertinence par rapport à une tâche à réaliser. De plus, notons quavec EXIT lexpert est placé au centre du processus. Notre approche a été validée à partir de quatre corpus de langues, de tailles et de domaines de spécialité différents. Enfin, une méthode fondée sur un processus dapprentissage supervisé est proposée afin daméliorer la qualité de la terminologie extraite.