ISBN-13: 9786131563409 / Francuski / Miękka / 2018 / 272 str.
ISBN-13: 9786131563409 / Francuski / Miękka / 2018 / 272 str.
Cette thA]se prA(c)sente un modA]le de construction automatique et approximatif de la reprA(c)sentation du sens d''un texte. On adapte des techniques de documentation automatique A des bases documentaires non indexA(c)es. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est reprA(c)sentA(c) par un descripteur, on dA(c)finit une distance entre ces descripteurs. L''accA]s aux documents pertinents est basA(c) sur des calculs de proximitA(c) entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais clustering) faisant apparaA(R)tre des thA]mes sA(c)mantiques. Il faut amA(c)liorer les techniques en leur permettant de traiter les documents non indexA(c)s, en amA(c)liorant les rA(c)sultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.
Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens dun texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. Laccès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais "clustering") faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.