6.4 t-Verteilung

Eine besondere Gruppe an Stichprobenkennwertverteilung, die mit der Standardnormalverteilung verwandt sind, nennt man t-Verteilungen. t-Verteilungen werden verwendet, um zu prüfen, ob sich zwei Mittelwerte überwahrscheinlich voneinander unterschieden. Beispielsweise, ob der Unterschied in der Größe zwischen Mann und Frau unwahrscheinlich ist, wenn man annimmt, dass sich Männer und Frauen nicht in ihrer Größe unterscheiden.

Wir verwenden eine t-Verteilung statt einer Standardnormalverteilung, wenn wir die Standardabweichung der Population nicht kennen. Dies ist meistens der Fall, daher werden in der Sozialforschung selten z-Tests berechnet.

Erneut müssen wir t-Verteilung verstehen lernen. Die t-Verteilung gibt an, wie unwahrscheinlich standardisierte Mittelwertsunterschied zwischen zwei Stichproben bzw. zwischen einer Stichprobe und einem fest definierten Wert sind, wenn wir annehmen, dass es keinen Unterschied zwischen zwei Mittelwerten gibt. Ein t-Wert von über 3 beispielsweise ist äußerst unwahrscheinlich, wenn wir davon ausgehen, dass es keinen Unterschied zwischen zwei Mittelwerten gibt. t-Werte von 0 sind sehr wahrscheinlich, da sie darauf hinweisen, dass zwei Mittelwerte identisch sind.

t-Werte kannst du dir wie besondere z-Werte vorstellen, wie wir sie gerade berechnet haben. Der einzige Unterschied ist, dass t-Verteilungen etwas breiter sind als die Standardnormalverteilung. Der Grund für die größere Breite der t-Verteilungen liegt darin, dass wir bei t-Tests einerseits die Standardabweichung der Population nicht kennen und kleinere Stichproben verwenden, die in der Regel etwas extremere Werte erzielen als größere Stichproben. Durch die Breite der Verteilung tragen wir diesen Unterschieden Rechnung.

In diesem Kurs werden wir t-Tests verwenden, um zwei verschiedene Fragestellungen zu beantworten. Zunächst werden wir den t-Test für eine Stichprobe kennenlernen, mithilfe dessen wir testen, ob sich ein Mittelwert einer Stichprobe von einem gegebenen Mittelwert unterscheidet. Beispielsweise können wir dadurch prüfen, ob eine bestimmte Stichprobe einen höheren Intelligenzquotienten hat als 100. Später werden wir im Modul einfaktorielle Varianzanalyse den t-Test für unabhängige Stichproben kennenlernen, mithilfe dessen wir testen, ob sich zwei Mittelwerte voneinander unterschieden. Beispielsweise indem wir prüfen, ob Männer größer sind als Frauen. Für jede der beiden Fragestellungen werden die t-Werte der t-Verteilung unterschiedlich berechnet.

6.4.1 t-Test für eine Stichprobe

Die Formel für den t-Wert für eine Stichprobe lautet:

\[ t_{df} = \frac{\hat{X} - B_0}{se} \]

\[ se = \frac{s}{\sqrt{N}} \]

\(B_0\) steht für einen vorgegebenen Wert, den wir nicht auf Grundlage einer Stichprobe erheben. Beispielsweise der Intelligenzquotient 100. \(s\) steht für die Standardabweichung der Stichprobe. Den Freiheitsgrad (\(df\)) kannst du berechnen, indem du 1 von der Anzahl der Datenpunkte (bzw. Probanden) abziehst: \(n - 1\). In anderen Worten ist der Freiheitsgrad nichts anderes als die restlichen Parameter, die wir noch in unser erweitertes Modell hinzufügen können (\(n - PA\)).

6.4.2 t-Test für unabhängige Stichproben

Wenn wir später den t-Test verwenden, um zwei Mittelwerte miteinander zu vergleichen, benötigen wir eine andere Formel für den t-Wert. Die Formel für den t-Wert bei einem t-Test für unabhängige Stichproben lautet:

\[ t_{df} = \frac{\hat{X_1} - \hat{X_2}}{se} \]

\[ se = \sqrt{\frac{s_1^2}{N_1} + \frac{s_2^2}{N_2}} \]

Den Freiheitsgrad (\(df\)) kannst du berechnen, indem du 2 von der Anzahl der Datenpunkte (bzw. Probanden) abziehst: \(n - 2\).

6.4.3 t-Verteilungen

Wie bereits beschrieben, ist die t-Verteilung eine besondere Form der Standardnormalverteilung. Die t-Verteilung ist unimodal und symmetrisch. Sie ist allerdings breiter als die Standardnormalverteilung. Weiterhin wird die t-Verteilung bei steigender Stichprobengröße der Standardnormalverteilung immer ähnlicher. Eine t-Verteilung mit einem Freiheitsgrad von 200 beispielsweise (\(201 - 1\) bei einem t-Test für eine Stichprobe) sieht optisch genau gleich aus wie eine Standardnormalverteilung. Schauen wir uns beispielsweise eine t-Verteilung mit einem Freiheitsgrad von 5 (grün), eine t-Verteilung mit einem Freiheitgrad von 20 (blau) und eine Standardnormalverteilung (blauer gestrichelter Strich) im Vergleich an:

t-Verteilungen (df = 5 und df = 20) vs. Standardnormalverteilung

Figure 6.13: t-Verteilungen (df = 5 und df = 20) vs. Standardnormalverteilung

An der Visualisierung kannst du drei Verteilungen erkennen. Die gestrichelte Linie kennzeichnet die Standardnormalverteilung. Die gelbe Verteilung kennzeichnet eine t-Verteilung mit einem Freiheitsgrad von 20. Die blaue Verteilung kennzeichnet eine t-Verteilung mit einem Freiheitsgrad von 5. In der nächsten Visualisierung siehst du eine t-Verteilung mit einem Freiheitsgrad von 100 und einer Standardnormalverteilung:

t-Verteilungen (df = 100) vs. Standardnormalverteilung

Figure 6.14: t-Verteilungen (df = 100) vs. Standardnormalverteilung

Beide Verteilungen sind im Grunde identisch. Wir werden in der Sozialforschung nur selten so hohe Stichproben erzielen. Allerdings zeigt dieses letzte Bild, dass die t-Verteilung und die Stanardnormalverteilung eng miteinander verwandt sind.