ISBN-13: 9786205085967 / Miękka / 132 str.
Text Mining (TM)-Techniken werden praktisch in Webanwendungen, in der akademischen,und Internet-Industrie und auch in anderen Bereichen. Im Bereich der Forschung unterstützen sie die Identifizierung und Kategorisierung von Forschungsarbeiten und verwandten Notizen aus vielen Bereichen, die von der jeweiligen Stelle selbst abgerufen werden können . Wenn eine Gruppe von Vorschlägen zu einem bestimmten Forschungsgebiet gehört und eine große Anzahl von Vorschlägen enthalten kann , werden diese Vorschläge gruppiert und dem Gutachter zurVerfügung gestellt . Die Ontologie-Methode ist eine mögliche Technik in diesem Bereich. Text-Mining-Methoden werden eingesetzt, um das Problem der automatischen Klassifizierung von Textdokumenten zu lösen. In dieser Arbeit werden dieForschungsanträge auf der Grundlage der Fachgebiete klassifiziert, und die Anträge in jedem Fachgebiet werden mithilfe der Text-Mining-Technik gruppiert. In Phase 1 werden Vorverarbeitungstechniken wie die Extraktion von Wörtern, Stoppwörtern, Stemming und Term Frequency-Inverse Document Frequency (TF/IDF) verwendet, um Tokenisierung, Wortstamm und Häufigkeit des Wortes im Forschungsvorschlag zu zählen. In Phase 2 wird der Ansatz vorgeschlagen, die Liste der MWTs, die automatisch aus einem domänenspezifischen Korpus von Textdokumenten extrahiert wurden , aufder Grundlage ihrer semantischen Ähnlichkeitin einer Hierarchie zuorganisieren .