Inferenzstatistik (eBook)
204 Seiten
Kohlhammer Verlag
978-3-17-032456-5 (ISBN)
Prof. Mark Stemmler und Dr. Martin Schmucker, Lehrstuhl für Psychologische Diagnostik, Methodenlehre und Rechtspsychologie der FAU Erlangen-Nürnberg.
1 Grundlagen der Inferenzstatistik
1.1 Ziel der Inferenzstatistik
Lernziele
Die grundlegende Problemstellung der Inferenzstatistik ist, von Daten, die an Stichproben gewonnen wurden, auf die Gegebenheiten in der Grundgesamtheit zu schließen (daher auch schließende Statistik). Die Stichprobe stellt einen möglichst repräsentativen Ausschnitt der Grundgesamtheit dar. Sie spiegelt die Gegebenheiten der Grundgesamtheit aber nicht exakt wider, sondern fehlerbelastet (Stichprobenfehler). Mittels der Inferenzstatistik lässt sich abschätzen, wie gut auf Basis der Stichprobe auf die Grundgesamtheit geschlossen werden kann.
Mit den Methoden der deskriptiven Statistik werden empirische Daten, die an Stichproben gewonnen wurden, durch zusammenfassende Kennwerte, grafische oder tabellarische Darstellungen beschrieben. Auf diese Weise können Verteilungseigenschaften von umfangreichen Einzeldaten ökonomisch und leicht fassbar dargestellt werden.
In der Wissenschaft geht es aber meist darum, allgemeingültige Aussagen zu treffen. Das heißt, dass das eigentliche Ziel nicht darin besteht, die Stichprobe darzustellen, sondern auf Basis der Stichprobendaten Aussagen zu treffen, die über diese hinausgehen: Es geht darum, die Stichprobenergebnisse auf die Grundgesamtheit zu verallgemeinern. Man spricht daher im Gegensatz zur beschreibenden oder deskriptiven Statistik auch von der schließenden Statistik oder Inferenzstatistik, da auf Basis einer relativ kleinen Menge von Untersuchungseinheiten (Stichprobe) auf alle potentiellen Untersuchungseinheiten (Grundgesamtheit) geschlossen werden soll.
1.2 Stichprobe und Grundgesamtheit
Definition: Grundgesamtheit und Stichprobe
Unter der Grundgesamtheit (auch: Population) versteht man die Gesamtmenge aller potentiellen Untersuchungseinheiten. Eine Stichprobe ist ein Ausschnitt aus der Grundgesamtheit. Bei der Stichprobenziehung werden nach bestimmten Methoden aus der Population Untersuchungseinheiten ausgewählt, die im Rahmen der Datenerhebung tatsächlich untersucht werden und die Population möglichst gut repräsentieren sollen.
Je nachdem über welche Grundgesamtheit man Aussagen treffen will, kann diese breiter (z. B. alle Menschen) oder enger definiert sein (z. B. alle in Deutschland lebenden Menschen oder alle Psychologiestudierenden an deutschen Hochschulen).
In aller Regel ist die Population zu groß, um sie vollständig zu untersuchen. Es wäre z. B. unrealistisch, alle in Deutschland lebenden Menschen untersuchen zu wollen (selbst wenn man nur eine Minute pro Person bräuchte, wäre man damit fast 150 Jahre beschäftigt – und zwar 24 h/Tag, 7 Tage/Woche, ohne zu schlafen oder Pausen zu machen). Stattdessen untersucht man lediglich einen Teil der Grundgesamtheit, eine sogenannte Stichprobe.
1.2.1 Stichprobenkennwerte und Populationsparameter
Stichprobendaten lassen sich mit Hilfe von Stichprobenkennwerten darstellen. So gibt das arithmetische Mittel () den durchschnittlichen Wert einer Variablen über alle Untersuchungsteilnehmer an. In gleicher Weise gibt es auch in der Population einen Durchschnittswert (μ; ausgesprochen: »mü«). Um statistische Kennwerte, die sich auf eine Stichprobe beziehen, und statistische Parameter, die sich auf die Grundgesamtheit beziehen, schnell unterscheiden zu können, kennzeichnet man diese bei Stichproben mit lateinischen Buchstaben. Wenn es dagegen um die Beschreibung von Grundgesamtheiten geht, zieht man griechische Buchstaben heran (▸ Tab. 1.1).
Tab. 1.1:Abkürzungen für Stichprobenkennwerte und Populationsparameter
| Stichprobenkennwert | Populationsparameter |
|---|
| Arithmetischer Mittelwert | x̄ | μ |
| Varianz | s2 | σ2 |
| Korrelation | r | ρ |
| Wahrscheinlichkeit | p |
Wenn nun das Ziel der Inferenzstatistik darin besteht, mittels Stichprobendaten auf die Grundgesamtheit zu schließen, so liegt es nahe, die Stichprobenkennwerte zu nutzen, um auf die Populationsparameter zu schließen. Und genau dies tut man auch. Je besser die Stichprobe die zugrundeliegende Population abbildet, desto exakter lassen sich über die Stichprobenkennwerte die Populationsparameter abschätzen. Aber die Stichprobendaten sind nie ein exaktes Abbild der Population. Man muss immer damit rechnen, dass sie mehr oder weniger fehlerbehaftet sind. Daraus ergibt sich auch, dass Stichprobenkennwerte die jeweiligen Populationsparameter nicht exakt abbilden, sondern mehr oder weniger stark davon abweichen können. Sie können das leicht selbst ausprobieren:
Experiment zur Ungenauigkeit von Stichprobendaten
Das arithmetische Mittel der Population aller Würfelwürfe beträgt μ = 3,5 (da die theoretische Verteilung von Würfelwürfen bekannt ist, ist auch der Populationsparameter bekannt).
Wenn Sie nun anhand von Stichprobendaten μ abschätzen wollen, können Sie z. B. 10-mal würfeln. Sie haben damit eine Stichprobe von n = 10 Würfelwürfen generiert. Bestimmen Sie den arithmetischen Mittelwert der 10 gewürfelten Augenzahlen. Vermutlich werden Sie feststellen, dass dieser Stichprobenmittelwert nicht exakt = 3,5 ist. Vermutlich werden Sie aber auch feststellen, dass er in der Nähe von 3,5 liegt. Führen Sie das Experiment noch einmal durch. Wieder wird der Mittelwert mehr oder weniger nahe an 3,5 liegen, aber vermutlich nicht exakt 3,5 betragen. Sie können dieses Experiment beliebig häufig wiederholen und werden feststellen, dass sich die Mittelwerte der einzelnen Stichprobenziehungen jeweils mehr oder weniger stark vom Populationsparameter = 3,5 und auch voneinander unterscheiden. Sie werden aber auch feststellen, dass die Ergebnisse in der Regel recht nahe bei 3,5 liegen und größere Abweichungen selten sind.
1.3 Stichprobenkennwerteverteilung
Wenn man das Würfelexperiment mit 10 Würfelwürfen und anschließender Bestimmung des arithmetischen Mittelwertes sehr häufig wiederholt, resultiert eine Verteilung der Mittelwerte, die sich um den Erwartungswert von = 3,5 verteilen wird (▸ Abb. 1.1).
Abb. 1.1:Verteilung der Mittelwerte bei n =10 Würfelwürfen
Man könnte das Beispiel auch mit anderen Kennwerten wiederholen (z. B. könnte man die Standardabweichungen bestimmen etc.). Eines würde immer gleichbleiben: Die resultierenden Kennwerte schwanken mehr oder weniger stark um den »wahren« Wert in der Population, den Populationsparameter. Die resultierende Verteilung bezeichnen wir als Stichprobenkennwerteverteilung (oft auch verkürzt: Stichprobenverteilung; englisch: sampling distribution). Je größer die Schwankungen sind, desto ungenauer ist die Schätzung des Populationsparameters durch den Stichprobenkennwert und desto vorsichtiger müssen wir sein, wenn wir auf Basis der Stichprobendaten Aussagen über die Grundgesamtheit treffen wollen.
Es wäre hilfreich, wenn wir angeben könnten, wie ungenau unsere Aussagen über die Population sind, d. h., wie groß die Schwankungen der Stichprobenkennwerteverteilung sind. Ein Kennwert, der bereits aus der deskriptiven Statistik bekannt ist, um die Schwankungen der Einzelwerte auszudrücken, ist die Standardabweichung. In äquivalenter Weise können die Schwankungen der Stichprobenkennwerte durch die Standardabweichung der Stichprobenkennwerteverteilung quantifiziert werden. Da es sich um einen besonderen Fall handelt, hat die Standardabweichung der Stichprobenkennwerteverteilung einen besonderen Namen: Sie wird als Standardfehler bezeichnet.
Definition: Standardfehler
Der Standardfehler (englisch: standard error [SE]) ist die Standardabweichung der Kennwerteverteilung von gleichgroßen Zufallsstichproben einer Grundgesamtheit.
1.3.1 Standardfehler des Mittelwerts
Ein in der empirischen Forschung sehr häufiger Anwendungsfall betrifft Aussagen über den Mittelwert einer Variablen (Populationsparameter μ). Der Stichprobenmittelwert ist ein erwartungstreuer Schätzer des Populationsparameters μ (▸ Kap. 2) μ. Wie im Beispiel mit den 10 Würfelwürfen gesehen, verschätzt der Stichprobenmittelwert den Populationsparameter mehr oder weniger stark und es ergeben sich Schwankungen, so dass sich als Stichprobenkennwerteverteilung die Verteilung der Mittelwerte...
| Erscheint lt. Verlag | 17.6.2025 |
|---|---|
| Mitarbeit |
Herausgeber (Serie): Bernd Leplow, Maria von Salisch |
| Zusatzinfo | 16 Abb., 32 Tab. |
| Sprache | deutsch |
| Themenwelt | Geisteswissenschaften |
| Medizin / Pharmazie ► Medizinische Fachgebiete ► Psychiatrie / Psychotherapie | |
| Schlagworte | Forschungsmethoden • Psychologische Diagnostik • Statistik |
| ISBN-10 | 3-17-032456-X / 317032456X |
| ISBN-13 | 978-3-17-032456-5 / 9783170324565 |
| Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
| Haben Sie eine Frage zum Produkt? |
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich