ISBN-13: 9783668147935 / Niemiecki / Miękka / 2016 / 64 str.
ISBN-13: 9783668147935 / Niemiecki / Miękka / 2016 / 64 str.
Examensarbeit aus dem Jahr 2007 im Fachbereich Informatik - Internet, neue Technologien, Note: 1,0, Ludwig-Maximilians-Universitat Munchen (Centrum fur Informations- und Sprachverarbeitung), 6 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Das Einkaufen im Internet hat sich neben dem stationaren Handel in den letzten Jahren zu einer tragenden Saule der Wirtschaft entwickelt. Die Menge der im Internet umgesetzten Waren hangt jedoch nicht zuletzt davon ab, ob der Verbraucher einen Anbieter und bei diesem das fur ihn passende Produkt findet. Ohne eine umfassende Klassifikation von Produkten und eine ausgereifte Suchtechnologie ist das jedoch kaum moglich. Groer manueller Aufwand dafur ist naturlich sehr kostspielig. Eine Moglichkeit dem zu begegnen, ist die Entwicklung von Werkzeugen, die durch umfassende Konfigurierbarkeit helfen, groe Mengen von Produkt- und Angebotsdaten weitestgehend automatisch zu analysieren und klassifizieren bzw. parametrisieren. Die Arbeit stellt einen Ansatz vor, der in einem kommerziellen Umfeld eingesetzt wird. Im Bereich des elektronischen Handels findet er Anwendung, um Prozesse der automatischen Verarbeitung von deutschsprachigen Produkt- und Angebotsdaten zu unterstutzen, die letztlich das Ziel haben, die zentrale Problematik des Online-Shoppings - das Suchen und Finden von Produkten - zu optimieren. Die Idee ist dabei, linguistische Informationen - insbesondere lexikalische Daten und syntaktische Strukturen - aus den Angebotstexten zu nutzen, um die darin beschriebenen Produkte zu klassifizieren. Die dafur relevanten Informationen werden mittels Informationsextraktion gewonnen und bearbeitet. Dabei werden bestimmte wiederkehrende und aussagekraftige Muster erkannt und formalisiert, so da durch Abstraktion auf einen Zusammenhang zwischen der Struktur des Angebotstextes und der Art und Zusammensetzung des konkreten Verkaufsobjektes geschlossen werden kann. Die Arbeit besteht aus zwei Teilen: einem theoretischen, ling