ISBN-13: 9783836494991 / Niemiecki / Miękka / 2008 / 52 str.
ISBN-13: 9783836494991 / Niemiecki / Miękka / 2008 / 52 str.
Die automatische Analyse von HTML-kodierten Inhalten stellt ein häufiges Problem in der Dokument-Verarbeitung dar. Ein Spezialfall ist die Analyse versionierter Varianten von HTML-Dateien, welche sich z.B. aus der periodischen Sicherung von Web-Seiten ergibt.Für dieses Buch wurden neue Ansätze zur Extraktion von Inhalten aus HTML-Seiten entwickelt, welche auf der Differenz-Analyse zweier Sicherungspunkte einer HTML-Seite basieren.Das Buch richtet sich in erster Linie an Leser im akademischen Umfeld, die sich mit neuen Verfahrenzur Verarbeitung von HTML-kodierten Inhalten auseinander setzen möchten, aber auch an Software-Entwickler, in deren Umfeld die automatischen Archivierung und Analyse von Webseiten eine entscheidende Rolle spielt.Es basiert auf einer 2004 entstandenen Diplomarbeit am Lehrstuhl für Kommunikationssysteme und Rechnernetze der Friedrich-Alexander-Universität in Erlangen.