ISBN-13: 9783486586916 / Niemiecki / Miękka / 2009 / 435 str.
Dieses Buch fuhrt ein in die grundlegenden Ansatze des Clusterns, Segmentierens und der Faktorextraktion. Kapitel 1 fuhrt ein in die Clusteranalyse. Nach einem intuitiven Beispiel anhand des Clusterns von Muscheln am Strand, und dem zugrundeliegenden, oft unausgesprochenen Cluster-Prinzipien werden u.a. die hierarchische, partitionierende und das TwoStep-Verfahren vorgestellt. Bei der hierarchischen Clusteranalyse (CLUSTER) werden die diversen Mae (z.B. quadrierte euklidische Distanz, Pearson-Korrelation, Chi-Ma etc.) und die jeweiligen Algorithmen (Density, Linkage, Ward etc.) einschl. ihrer Bias (z.B. Ausreier, Chaining) erlautert. Anhand zahlreicher Beispiele wird erlautert, wie Intervalldaten, Haufigkeiten, Kategorialdaten, sowie gemischte Daten geclustert werden. Bei der partitionierenden Clusterzentrenanalyse (k-means, QUICK CLUSTER) lernen Sie Teststatistiken zur Bestimmung der optimalen Clusterzahl kennen (z.B. Eta, F-max; nicht im original SPSS Leistungsumfang enthalten), sowie die ausgewahlte Clusterlosung auf Interpretierbarkeit, Stabilitat und Validitat zu prufen. Bei der Two-Step Clusteranalyse (TWOSTEP CLUSTER) lernen Sie die Clusterung von gemischten Daten anhand eines Scoring-Algorithmus kennen Daruber hinaus lernen Sie Kriterien fur die Beurteilung einer guten Clusterlosung kennen, wie auch alternative grafische und logische Ansatze zur Clusterung von auch Daten im String-Format. Kapitel 2 fuhrt ein in die Gruppe der Faktorenanalyse mit SPSS. Die Faktorenanalyse (factor analysis, FA) ist ein Sammelbegriff fur verschiedene Verfahren, die es ermoglichen, aus einer groen Zahl von Variablen eine moglichst geringe Anzahl von (nicht beobachteten) 'Faktoren' zu erhalten ('extrahieren'). Die Faktorenanalyse geht nicht von unabhangigen oder abhangigen Variablen aus, sondern behandelt alle Analysevariablen unabhangig von einem Kausalitatsstatus. Dieser Kurs fuhrt in das Grundprinzip und Varianten der Faktorenanalyse (z.B. Alpha, Hauptfaktoren, Hauptkomponenten), die wichtigsten Extraktions-, wie auch Rotationsmethoden (z.B. orthogonal vs. oblique) und ihre Funktion. Vorgestellt werden Kriterien zur Bestimmung, Interpretation und Benennung der Faktoren. Dieser Kurs stellt ausschlielich die Variante der explorativen Faktorenanalyse (EFA) vor (R-Typ). Abschliessend werden eine Faktorenanalyse fur Falle (Q-Typ Faktorenanalyse vorgestellt, sowie eine Matrix-Variante, die dann zum Einsatz kommen kann, wenn die korrelationsanalytischen Voraussetzungen der Faktorenanalyse nicht erfullt sind. Die Uberprufung der Voraussetzungen und die Interpretation der Statistiken werden an zahlreichen Beispielen geubt. Kapitel 3 stellt die Diskriminanzanalyse (DA, syn.: DFA, Diskriminanzfunktionsanalyse) vor. Das zentrale Ziel dieses Ansatzes ist, die beste Trennung (Diskriminanz) zwischen den Zugehorigkeiten einer abhangigen Gruppenvariable fur mehrere unabhangige Einflussvariablen zu finden. In anderen Worten, die Diskriminanzanalyse liefert die Antwort auf die Frage: Welche Kombination von Einflussvariablen erlaubt eine maximal trennende Aufteilung der Falle in die bekannten Auspragungen einer Gruppe? Weitere, damit in Zusammenhang stehende Fragen konnen sein: Auf welche Weise werden die Falle klassiert, wie genau werden die Falle klassiert (erkennbar an der Anzahl der Fehlklassifikationen), und wie sind die schlussendlich entstehenden Klassifizierungen zu interpretieren? Es werden u.a. diverse Methoden der Variablenselektion (direkt, schrittweise), sowie auch die Berechnung und Interpretation multipler schrittweiser Diskriminanzanalysen mit mehreren ermittelten Funktionen vorgestellt (einschliesslich Lambda, Box-Test, Kreuzvalidierung (Interpretation von Kovarianz-Matrizen), das Identifizieren von Multikollinearitat, sowie Gebietskarten (Territorien). Weitere Kapitel stellen Moglichkeiten des Clusterns und Segmentierens (u.a. mit CLEMENTINE, Entscheidungsbaume und ausgewahlte Cluster-Knoten. In einem abschlieenden Kapitel sind ausgewahlte Formeln der wichtigsten behandelten Verfahren zusammengestellt. Zahlreiche Rechenbeispiele werden von der Fragestellung, der Anforderung der einzelnen Statistiken (per Maus, per Syntax) bis hin zur Interpretation der SPSS- und CLEMENTINE Ausgaben systematisch durchgespielt. Auch auf mogliche Fallstricke und haufig begangene Fehler wird eingegangen. Separate Abschnitte stellen die diversen Voraussetzungen fur die Durchfuhrung der jeweiligen Analyse, sowie Ansatze zu ihrer Uberprufung zusammen. Dieses Buch ist angenehm verstandlich und anwendungsorientiert geschrieben, ohne jedoch die Komplexitat und damit erforderliche Tiefe bei der Vorstellung der Verfahren zu vernachlassigen. Dieses Buch ist fur Einsteiger, Studierende, sowie fortgeschrittene Wissenschaftler in den Wirtschafts-, Bio-, und Sozialwissenschaften gleichermaen geeignet.