9.8 A priori-Hypothesen mit Kontrasten testen

Was hilft es uns allerdings zu prüfen, ob sich irgendwelche Mittelwerte voneinander unterscheiden? In der Regel haben wir spezifische Hypothesen, die wir testen möchten. Beispielsweise, ob Väter als Erziehungsberechtigte negativere Auswirkungen auf den Alkoholkonsum der Kinder haben als Mütter. Bei solchen Hypothesen, die wir haben, bevor die Daten erhoben wurden, sprechen wir von a priori Hypothesen. Diese werden in der Regel anhand von Kontrasten getestet.

Im diesem Teil versuchen wir eine spezifische Hypothese anhand von Kontrastanalysen zu testen. Nämlich, ob Väter als Erziehungsberechtigte negativere Auswirkungen auf den Alkoholkonsum der Kinder haben als Mütter. Zunächst berechnen wir diese Hypothese händisch nach unserem gängigen Prinzip, dann werden wir die Hypothesen direkt in R mithilfe des Pakets emmeans testen.

9.8.1 Aufstellen der Kontraste

Zunächst müssen wir die Kontraste definieren, mithilfe derer wir unsere Hypothese testen können. Ein Kontrast muss so formuliert sein, dass wir den Mittelwertunterschied zwischen Vätern und Müttern testen:

father mother other
\(\lambda_{1}\) 1 -1 0
\(\lambda_{2}\) 1 1 -2

Oder im Modell ausgedrückt:

\[ \begin{aligned} \hat{Y} &= b_0 + b_1 * (1) &+ b_2 * (1) \\ \hat{Y} &= b_0 + b_1 * (-1) &+ b_2 * (1) \\ \hat{Y} &= b_0 + b_1 * (0) &+ b_2 * (-2) \end{aligned} \]

Der erste Kontrast prüft hierdurch den Mittelwertunterschied der beiden Gruppen father und mother. Der zweite Kontrast prüft, ob der Alkoholkonsum bei Kindern die Väter oder Mütter als Erziehungsberechtigte haben, größer ist, als bei anderen Erziehungsberechtigten. Uns interessiert nun allerdings hauptsächlich der erste Kontrast.

In R können wir diese Kontraste als Matrix definieren:

##        [,1] [,2]
## father    1    1
## mother   -1    1
## other     0   -2

9.8.2 Aufstellen der Modelle

Als Nächstes müssen wir erneut unsere Modelle aufstellen. Hierfür müssen wir erneut unsere Kategorien in numerische Werte überführen:

Unser erweitertes Modell lautet daher:

## 
## Call:
## lm(formula = Walc ~ guardian, data = student_data)
## 
## Coefficients:
## (Intercept)    guardian1    guardian2  
##     2.24497      0.02387      0.07561

\[ \begin{aligned} MODEL\ A &= 2.24497 + 0.02387 * X_1 + 0.07561 * X_2 \\ \end{aligned} \]

Anders als bei der einfaktoriellen Varianzanalyse, bei der wir lediglich Mittelwertunterschiede mehrere Gruppen testen, benötigen wir hier als kompaktes Modell nicht den Mittelwert der abhängigen Variable, sondern wir müssen prüfen, ob das Hinzufügen des Parameters \(X_1\) zu einer deutlichen Reduktion des Fehlers führt:

\[ \begin{aligned} MODEL\ A &= b_0 + b_1 * X_1 &+ b_2 * X_2 \\ MODEL\ C &= b_0 + b_1 * X_1 &+ b2 * X_2 \\ &= b_0 + 0 * X_1 &+ b2 * X_2 \\ &= b_0 &+ b2 * X_2 \end{aligned} \]

Daher lauten unsere Modelle:

\[ \begin{aligned} MODEL\ A &= 2.24497 + 0.02387 * X_1 &+ 0.07561 * X_2 \\ MODEL\ C &= 2.24497 &+ 0.07561 * X_2 \end{aligned} \]

Als Nächstes müssen wir unsere Gruppen in die vorher definierten Kontraste umwandeln:

## Observations: 395
## Variables: 2
## $ x1 <dbl> -1, 1, -1, -1, 1, -1, -1, -1, -1, -1…
## $ x2 <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …

9.8.3 Prüfung der Hypothese

Nun können wir unsere Hypothese durch einen F-Test prüfen. Der einzige Unterschied zur bisherigen Vorgehensweise ist, dass wir nun \(SSR\) durch eine alternative Formel berechnen.

\[ SSR = \frac{(\sum_k{\lambda_k * \bar{Y}_k)^2}}{\sum_k (\lambda_k^2 / n_k)} \]

\(\lambda_k\) steht für die einzelnen Kontrastgewichte, \(\bar{Y}_k\) für die Mittelwerte der einzelnen Gruppen. \(n_k\) steht für die Anzahl der Probanden pro Gruppe. Wir können SSR berechnen, indem wir zunächst die Mittelwerte und die Probanden pro Gruppe ermitteln:

guardian mean n
father 2.344444 90
mother 2.296703 273
other 2.093750 32

\(SSR\) ist demnach:

## [1] 0.15427

Nun können wir \(SSE_C\) und \(SSE_A\) berechnen:

## [1] 652.2149
## [1] 652.008
## [1] 0.09275017
## [1] 0.7608712
## [1] 0.0002365516
Source SS df MS F p \(\eta^2_p\)
Reduction 0.15427 1 0.15 0.09 .76 0.002
Error 652.008 392 1.66
Total Error 653.519 394

Unser Ergebnis zeigt uns, dass es keinen Unterschied beim Alkoholkonsum der SuS macht, ob Väter oder Mütter die Erziehungsberechtigten sind. Der Effekt ist zudem minimal.

9.8.4 Kontraste in Jamovi berechnen

Die gleiche Berechnung können wir direkt in Jamovi testen, indem wir zunächst die gleichen Berechnungen wie bei der einfaktoriellen Varianzanalyse durchführen:

Im nächsten Schritt bestimmst du die Kontraste in Jamovi. Jamovi erlaubt nur eine Auswahl an bestimmten Kontrasten, allerdings kannst du verschiedene Auswählen und somit relativ schnell zu dem gewünschten Kontrast kommen:

Erneut sind diese Ergebnisse äquivalent zu unserem F-Test. Der t-Wert ist die Wurzel des F-Werts:

## [1] 0.3045491

9.8.5 Kontraste mit emmeans berechnen

Den gleichen Kontrast können wir mit dem Paket emmeans direkt in R berechnen. Hierfür müssen wir zunächst das Paket installieren und laden:

Anschließend können wir das Modell berechnen und in die Funktion emmeans übergeben:

##  guardian emmean     SE  df lower.CL upper.CL
##  father     2.34 0.1359 392     2.08     2.61
##  mother     2.30 0.0781 392     2.14     2.45
##  other      2.09 0.2280 392     1.65     2.54
## 
## Confidence level used: 0.95

Hierdurch erhalten wir die Konfidenzintervalle der drei Gruppen. Anschließend übergeben wir diesen Output in die Funktion contrast. Vorher müssen wir noch sicher stellen, dass wir die Reihenfolge unserer Levels kennen:

## [1] "father" "mother" "other"

Der erste Wert ist daher der Vater, der zweite die Mutter und der dritte alle anderen Erziehungsberechtigten. Berechnen wir nun den Kontrast:

##  contrast         estimate    SE  df t.ratio p.value
##  father_vs_mother   0.0477 0.157 392 0.305   0.7609

Du kannst erkennen, dass der Output äquivalent zu Jamovi ist. Würden wir mehrere Kontraste gleichzeitig testen wollen, könnten wir diese folgendermaßen aufstellen:

##  contrast         estimate    SE  df t.ratio p.value
##  father_vs_mother   0.0477 0.157 392 0.305   0.7609 
##  father_vs_rest     0.2984 0.363 392 0.821   0.4119

Im Hintergrund berechnet R zwei Hypothesen, die je folgende Modelle miteinander vergleichen:

\[ \begin{aligned} MODEL\ A &= b_0 + b_1 * X_1 &+ b_2 * X_2 \\ MODEL\ C &= b_0 + b_1 * X_1 &+ b2 * X_2 \\ &= b_0 + 0 * X_1 &+ b2 * X_2 \\ &= b_0 &+ b2 * X_2 \end{aligned} \]

9.8.6 Kontraste berichten

Zuletzt können wir unser Ergebnis berichten und fügen es zu unserer einfaktoriellen Varianzanalyse an:

Um unsere Hypothese zu überprüfen, wurde eine einfaktorielle Varianzanalyse mit dem Alkoholkonsum der SuS am Wochenende als abhängige Variable und den Erziehungsberechtigten als unabhängige Variable berechnet. Es ergab sich kein signifikanter Effekt des Faktors Erziehungsberechtigter, F(2, 392) = 0.45, p = .63, \(\eta^2_p\) = 0.002 (kein Effekt). Die Ergebnisse deuten darauf hin, dass die Wahl der Erziehungsberechtigten keinen Effekt auf den Alkoholkonsum der SuS am Wochenende macht. Weitere spezifische Kontrastanalysen konnten zeigen, dass Kinder, die Väter als Erziehungsberechtigte haben, nicht signifikant mehr Alkohol trinken als Kinder, die Mütter als Erziehungsberechtigte haben, F(1, 392), p = .76, \(\eta^2_p\) = 0.002 (kein Effekt).