ISBN-13: 9786205037102 / Miękka / 120 str.
In diesem Buch wird eine neue Clustering-Technik für kategoriale Daten vorgestellt. Die Effektivität eines Clustering-Verfahrens wird im Wesentlichen durch zwei Aspekte bestimmt: die Suchmethode und die Kriterien für die Nähe. Der vorgeschlagene Algorithmus verwendet einen genetischen Algorithmus für das Clustering, der sich in den Experimenten als effiziente Clustering-Methode für kategoriale Daten erwiesen hat. Die Proximity-Kriterien verwenden ein regelbasiertes informationstheoretisches Maß, das Weight of Evidence. Es findet die interessanten Muster und misst das Gewicht dieser Muster, die das Vorhandensein eines Zielwertpaares unterstützen, um für ein Cluster-Label relevant zu sein. Durch Aufsummieren des Gesamtgewichts, das die Datensätze in den Mustern aufgrund des Vorhandenseins sowohl des Zielwerts als auch des entsprechenden Cluster-Labels erhalten, wird die Fitness im Chromosom gemessen und somit festgestellt, wie gut die Datensätze zusammen geclustert sind.