Clusterstabilität
Konzepte und Einflussfaktoren
Seiten
Clusterverfahren erfreuen sich im Rahmen des Data Mining einer großen Beliebtheit und werden in diesem Kontext besonders oft angewendet. Häufig wird jedoch außer Acht gelassen, dass die dabei erzielten Ergebnisse ohne eine theoretische Fundierung nicht über die Stichprobe hinaus auf die Grundgesamtheit verallgemeinert werden können.
Um eine solche Verallgemeinerung aus statistischer Sicht tätigen zu können, ist zunächst eine Betrachtung von Clusterverfahren im Allgemeinen unumgänglich, wobei die unterschiedlichen Ansätze der Verfahren besonders interessant sind. Aber auch eine saubere stochastische Spezifikation der Ausgangssituation, sowie die Analyse der Methoden zur Clustervalidierung sind Teil einer solchen Untersuchung.
Entscheidend für eine Verallgemeinerung ist die Veränderung der Clusterergebnisse beim statistischen Schluss von der Stichprobe auf die Population. Handelt es sich um einen stabilen Clusteralgorithmus, so kann davon ausgegangen werden, dass die Veränderungen gering sind. Neben einer formalen Definition von Stabilität werden als Analysegrundlage die klassischen Werkzeuge der robusten Statistik benötigt.
Bei der Analyse erweist sich die Datenrepräsentation als ein maßgeblicher Einflussfaktor. Am Beispiel der Netzwerkanalyse wird die Anwendbarkeit des entwickelten Clusterstabilitätsbegriffes gezeigt. Mit Hilfe von Wahrscheinlichkeitsnachbarschaften ist es möglich, einen verallgemeinerten Kommunitätsbegriff zu definieren.
Andreas Baumgart, Jahrgang 1982, studierte Wirtschaftsinformatik an der Universität Leipzig und der Westfälischen Wilhelms-Universität Münster. Im Anschluss war er als wissenschaftlicher Mitarbeiter am European Research Center for Information Systems (ERCIS) in Forschung und Lehre tätig. Im November 2013 erfolgte die Promotion zum Doktor der Wirtschaftswissenschaften.
Um eine solche Verallgemeinerung aus statistischer Sicht tätigen zu können, ist zunächst eine Betrachtung von Clusterverfahren im Allgemeinen unumgänglich, wobei die unterschiedlichen Ansätze der Verfahren besonders interessant sind. Aber auch eine saubere stochastische Spezifikation der Ausgangssituation, sowie die Analyse der Methoden zur Clustervalidierung sind Teil einer solchen Untersuchung.
Entscheidend für eine Verallgemeinerung ist die Veränderung der Clusterergebnisse beim statistischen Schluss von der Stichprobe auf die Population. Handelt es sich um einen stabilen Clusteralgorithmus, so kann davon ausgegangen werden, dass die Veränderungen gering sind. Neben einer formalen Definition von Stabilität werden als Analysegrundlage die klassischen Werkzeuge der robusten Statistik benötigt.
Bei der Analyse erweist sich die Datenrepräsentation als ein maßgeblicher Einflussfaktor. Am Beispiel der Netzwerkanalyse wird die Anwendbarkeit des entwickelten Clusterstabilitätsbegriffes gezeigt. Mit Hilfe von Wahrscheinlichkeitsnachbarschaften ist es möglich, einen verallgemeinerten Kommunitätsbegriff zu definieren.
Andreas Baumgart, Jahrgang 1982, studierte Wirtschaftsinformatik an der Universität Leipzig und der Westfälischen Wilhelms-Universität Münster. Im Anschluss war er als wissenschaftlicher Mitarbeiter am European Research Center for Information Systems (ERCIS) in Forschung und Lehre tätig. Im November 2013 erfolgte die Promotion zum Doktor der Wirtschaftswissenschaften.
Die Kunst der Übersetzung
| Erscheint lt. Verlag | 19.6.2015 |
|---|---|
| Reihe/Serie | Advances in Information Systems and Management Science ; 50 |
| Sprache | deutsch |
| Maße | 170 x 240 mm |
| Einbandart | Paperback |
| Themenwelt | Mathematik / Informatik ► Mathematik ► Wahrscheinlichkeit / Kombinatorik |
| Schlagworte | Clusteranalyse • Clustervalidierung • Netzwerkanalyse • robuste Statistik • Stabilität • Stabilität |
| ISBN-10 | 3-8325-3603-5 / 3832536035 |
| ISBN-13 | 978-3-8325-3603-9 / 9783832536039 |
| Zustand | Neuware |
| Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
| Haben Sie eine Frage zum Produkt? |
Mehr entdecken
aus dem Bereich
aus dem Bereich
Stochastik: von Abweichungen bis Zufall
Buch | Softcover (2025)
De Gruyter (Verlag)
CHF 48,90
Buch | Softcover (2024)
Springer Spektrum (Verlag)
CHF 69,95