ISBN-13: 9786203495621 / Francuski / Miękka / 228 str.
Ce travail est consacré aux problèmes de développement de logiciels linguistiques et algorithmiques qui servent à créer un système moderne d'extraction d'informations clés sur le contenu grâce à l'application d'une large classe de méthodes mathématiques et linguistiques de traitement logique et analytique de grands tableaux de caractères. Dans le cadre de cette recherche, un schéma généralisé de traitement d'un ensemble de textes publicistes pour le sous-langage des médias, les tendances identifiées, en tenant compte des résultats du traitement des textes en langue naturelle, effectué par l'ordinateur et l'homme, ont proposé un modèle du texte comme un composite de modèles formels de ses composants, qui est basé sur l'intégration de méthodes statistiques et linguistiques formelles, L'algorithme d'extraction des éléments de signification à partir de l'ensemble des textes de sujets limités, y compris le bloc de traitement sémantique primaire, le bloc d'indexation et de classement des concepts, le bloc d'établissement des relations, le bloc d'identification de l'unité thématique, le bloc d'établissement de l'occurrence des paires, le bloc de construction d'un réseau sémantique, le bloc de synthèse des informations du réseau.