9.6 t-Test für unabhängige Stichproben

Nun, da wir Kontraste kennen, können wir Forschungsfragen beantworten, die es uns erlauben zu prüfen, ob es Mittelwertunterschiede zwischen Gruppen gibt. Die einfachste Frage, die wir uns stellen können, ist ob sich die Mittelwerte von zwei Gruppen voneinander unterscheiden. Gemeinhin werden solche Tests als t-Test für unabhängige Stichproben genannt. Für uns ist dieser Test lediglich eine Erweiterung der Modelle, die wir bereits kennengelernt haben.

9.6.1 Kompaktes und erweitertes Modell

Stell dir vor, du möchtest prüfen, ob Männer mehr Alkohol am Wochenende trinken als Frauen. Um diese Hypothese zu prüfen, müssen wir ein Modell mit einem Prädiktor aufstellen und die Kontrastgewichte bestimmen. Schauen wir uns zunächst die Mittelwerte der beiden Gruppen für die abhängige Variable Walc an:

## # A tibble: 2 x 2
##   sex   mean_alc
##   <chr>    <dbl>
## 1 F         1.96
## 2 M         2.66

Männer trinken deutlich mehr als Frauen. Du siehst zudem, dass die Variable sex als Text gespeichert ist. Um unser Modell zu bestimmen, müssen wir daher die Variable in einen Faktor umwandeln:

## [1] "F" "M"

Du siehst nun, dass die Variable sex die Levels “F” und “M” hat. Schauen wir uns als nächstes die Kontrastgewichte an, die R diesem Faktor zugewiesen hat:

##   M
## F 0
## M 1

Eine Dummykodierung. Wenn wir unser erweitertes Modell nun aufstellen, erhalten wir folgendes Modell:

## 
## Call:
## lm(formula = Walc ~ sex, data = student_data)
## 
## Coefficients:
## (Intercept)         sexM  
##      1.9567       0.7064

\[ \hat{Y} = 1.9567 + 0.7064 * X_1 \]

Anhand der Mittelwerte von oben, kannst du nun erkennen, dass der Intercept dem Mittelwert der Frauen entspricht und der Prädiktor der Differenz der Mittelwerte beider Gruppen. Wir möchten allerdings Kontrastgewichte erstellen, für die gilt:

\[ \sum_k \lambda_k = 0 \]

Ändern wie diese Kontraste dementsprechend, um unser erweitertes Modell zu erhalten:

##   [,1]
## F    1
## M   -1
## 
## Call:
## lm(formula = Walc ~ sex, data = student_data)
## 
## Coefficients:
## (Intercept)         sex1  
##      2.3099      -0.3532

Nun lautet unser erweitertes Modell:

\[ \hat{Y} = 2.3099 -0.353 * X_1 \]

Der Intercept repräsentiert nun den Mittelwert der Mittelwerte beider Gruppen und \(b_1\) repräsentiert die halbierte Differenz der Mittelwertdifferenz der beiden Gruppen.

Unsere Modelle lauten daher:

\[ \begin{aligned} MODEL\ A &= 2.3099 -0.353 * X_1 \\ MODEL\ C &= 2.291139 \end{aligned} \]

Wir prüfen mit diesem Modell, ob wir durch das Hinzufügen der Gruppenmittelwerte unsere Fehler substantiell reduzieren. Gleichzeitig können wir durch diesen Test prüfen, ob es einen Mittelwertunterschied der beiden Gruppen gibt, sprich, ob Männer wirklich mehr trinken als Frauen.

9.6.2 F-Test zur Prüfung der Hypothese

Um diese Hypothese zu prüfen, berechnen wir erneut \(SSE_C\), \(SSE_A\), \(SSR\), \(PRE\), und \(F\). Vorher müssen wir jedoch die Variable sex in unsere Kontraste überführen:

## Observations: 395
## Variables: 1
## $ sex_numeric <dbl> 1, 1, 1, 1, 1, -1, -1, 1, -…

Als Nächstes prüfen wir die Hypothese durch unseren gängigen F-Test:

## [1] 0.0751822
## [1] 31.94857
## [1] 3.04677e-08
Source SS df MS F p PRE
Reduction 49.133 1 49.13 31.95 < .001 0.08
Error 604.386 393 1.54
Total Error 653.519 394

Tatsächlich, Männer trinken mehr Alkohol am Wochenende als Frauen. Immer, wenn wir eine Hypothese prüfen, möchten wir zudem wissen, wie hoch der Effekt hierfür ist. Bei einer einfaktoriellen Varianzanalyse mit zwei Gruppen, können wir hierfür \(\eta^2\) berechnen:

\[ \eta^2 = \frac{SSR}{SS_{total}} \]

## [1] 0.0751822

\(\eta^2\) ist demnach das gleiche wie \(PRE\). Der Effekt ist mittelgroß.

9.6.3 Äquivalenz zum t-Wert für unabhängige Stichproben

Der t-Test wird selten anhand eines F-Tests erklärt. Für uns war dies allerdings recht praktisch, da wir dadurch auf ein bekanntes Prinzip zurückgreifen können. Wir wissen bereits, dass die t-Statistik nichts anderes ist als die Wurzel der F-Statistik. Der t-Test für unabhängige Stichproben ist zudem ein besonderer F-Test bei dem der erste Freiheitsgrad auf 1 gesetzt wird.

## [1] 5.652306

Der t-Wert lautet daher \(5.65\). An dieser Stelle ist es wichtig, zwischen gerichteten und ungerichteten Hypothesen zu unterschieden. Bei einer ungerichteten Hypothese sprechen wir, wenn gilt:

\[ M_1 != M_2 \]

Wir glauben daher, dass es einen Unterschied zwischen Gruppen gibt, wissen aber nicht in welche Richtung dieser Unterschied geht. Bei der gerichteten Hypothese gehen wir von folgendem Szenario aus:

\[ M_1 > M_2 \]

Oder:

\[ M_1 < M_2 \]

Der F-Test ist immer ungerichtet. Wenn wir den empirischen t-Wert daher an der t-Verteilung abbilden, müssen wir den kritischen Bereich auf beide Seiten der Verteilung aufteilen:

t-Wert bei der ungerichteten Hypothese Männer != Frauen

Figure 9.1: t-Wert bei der ungerichteten Hypothese Männer != Frauen

Unsere Hypothese ist allerdings gerichtet. Als Folge liegt der kritische Bereich nur auf einer Seite vor:

t-Wert bei der gerichteten Hypothese Männer > Frauen

Figure 9.2: t-Wert bei der gerichteten Hypothese Männer > Frauen

Für unsere Hypothese macht dies keinen Unterschied, da der empirische t-Wert sehr groß und positiv ist. Wäre der empirische t-Wert hingegen bei ~ 2.5 kann die Wahl der Richtung der Hypothese über die Signifikanz des Ergebnisses entscheiden.

9.6.4 t-Test für unabhängige Stichproben in Jamovi

Versuchen wir den gleichen Test in Jamovi zu testen:

Anschließend fügen wir unsere abhängige, unabhängige Variable ein und lassen uns die Effektgröße ausgeben. Zusätzlich geben wir an, das wir eine gerichtete Hypothese testen:

Die Ergebnisse sind offensichtlich die gleichen, die wir bereits berechnet haben. Als Nächstes geben wir uns den R-Code aus und fügen diesen in R ein:

9.6.5 Ergebnis berichten

Würden wir die Ergebnisse unserer Hypothese in einem Manuskript berichten, würden wir folgendes aufschreiben:

Um zu prüfen, ob Männer mehr am Wochenende trinken als Frauen, wurde ein t-Test für unabhängige Stichproben berechnet. Die abhängige Variable war der wöchentliche Alkoholkonsum der SuS, die unabhängige Variable war das Geschlecht (männlich bzw. weiblich). Der t-Test ergab einen signifikanten Effekt des Geschlechts, t(393) = 5.65, p < .001, d = 0.57 (mittlerer Effekt), was darauf hinweist, dass Männer am Wochenende mehr Alkohol trinken als Frauen.