ISBN-13: 9786206403463 / Niemiecki / Miękka / 76 str.
Text Mining oder Data Mining ist ein Werkzeug zur Wissensentdeckung, das sich auf den Prozess der Extraktion interessanter und nicht-trivialer Muster aus einer Datenbank mit unstrukturierten Texten bezieht. Hier stellen wir ein neues maschinelles Lernsystem vor, das biologische Datensätze (Textdaten/wissenschaftliche Literatur) auswertet, um Beziehungen zwischen zwei Genen (zwei Begriffen) in einem wissenschaftlichen Text zu verstehen. Das System ahmt die menschliche Intelligenz nach und bestimmt genau die Beziehungen zwischen zwei Genen/Proteinen. Wir haben Literaturdatensätze manuell mit Deep Curation kuratiert, um einen Trainingssatz zu erstellen. Darüber hinaus wurden unsere Vorhersageergebnisse mit Hilfe von Experten validiert, um das Vertrauen zu schaffen, unser System in verschiedenen Echtzeitsituationen einzusetzen. Anschließend wurde das System automatisiert, so dass Menschen auf der ganzen Welt mithilfe von Support-Vektor-Maschinen Beziehungen zwischen zwei oder mehr Molekülen in einem Text bestimmen können. Dieses halbautomatische System wird von unserem Team häufig eingesetzt, um Bewertungen zu einem bestimmten Thema zu verfassen. So konnte unser Team beispielsweise mehr als 36000 Artikel durchsuchen und auswerten, um einen Bericht über molekulare Docking-Tools zu schreiben. Im Jahr 2016 war unser Team in der Lage, das molekulare Netzwerk der Fettleibigkeit mit diesem System zu rekonstruieren (Jaisri et al 2016, Plos One).