Dublettenerkennung bezeichnet einen Prozess zur Ermittlung ahnlicher oder identischer Datensatze, die sich auf das gleiche Objekt der realen Welt beziehen. Eine besondere Bedeutung hat diese im Rahmen einer Datenbereinigung zum Beispiel nach dem Zusammenfuhren verschiedener Datenbestande mit moglichen Uberlappungen. In diesem Zusammenhang haben sich in den letzten Jahren einige interessante Entwicklungen ergeben. Zum einen steigen die erfassten Datenmengen immer weiter an, so dass Algorithmen an Bedeutung gewinnen, die auch in solchen grossen Datenbestanden effizient arbeiten. Zum anderen...
Dublettenerkennung bezeichnet einen Prozess zur Ermittlung ahnlicher oder identischer Datensatze, die sich auf das gleiche Objekt der realen Welt bezi...