ISBN-13: 9783640518647 / Niemiecki / Miękka / 2010 / 28 str.
Forschungsarbeit aus dem Jahr 2009 im Fachbereich Informatik - Didaktik, Note: 1, Ludwig-Maximilians-Universitat Munchen (Centrum fur Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum grossten existierenden und frei verfugbaren Daten- und Informationsbestand entwickelt. Im Netz, wo es ein absoluter Datenuberfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach benotigten Informationen wird durch unzahlige Dokumente gestobert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. Wahrend die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert konnen, bleibt ein sehr grosser Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zuruckgefuhrt. Die gesuchten Informationen sind nicht mehr statisch verfugbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt. In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden konnen. Im nachsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinne