9.7 Einfaktorielle Varianzanalyse mit mehreren Gruppen

Nun, da wir wissen, was orthogonale Kontraste sind, können wir Hypothesen testen, bei denen wir mehrere Mittelwerte miteinander vergleichen. Beispielsweise können wir uns die Frage stellen, ob der Haupterziehungsberechtigte des Kindes einen Einfluss auf den Alkoholkonsum der Kinder hat. Man könnte sich beispielsweise vorstellen, dass ein Vater als Erziehungsberechtigter weniger darauf achtet, ob das Kind trinkt als die Mutter als Erziehungsberechtigte, da Männer in der Regel mehr trinken als Frauen.

Mit der einfaktoriellen Varianzanalyse prüfen wir, ob es Unterschiede zwischen mehreren Gruppen gibt. Wir prüfen nicht, welche Gruppen sich voneinander unterscheiden. Hierfür werden wir im nächsten Teil spezifische Kontraste rechnen.

9.7.1 Aufstellen der Modelle

Erneut müssen wir zunächst unsere Modelle aufstellen. Schauen wir uns dazu zunächst die Variable guardian and und wandeln sie in einen Faktor um:

## [1] "father" "mother" "other"

Wir haben nun die Variable guardian so kodiert, dass der Vater zuerst kommt, dann die Mutter, dann alle anderen Erziehungsberechtigten. Als Nächstes müssen wir orthogonale Kontraste für diese Variable definieren (erneut: Dies dient der Illustration, du musst später diese Berechnungen nicht durchführen). Da wir drei Gruppen haben, benötigen wir zwei Kontraste. Wir verwenden hierfür erneut die Kontraste, die wir bereits für drei Gruppen kennen. Wir werden später allerdings gleich feststellen, dass für unsere Fragestellung die Wahl der orthogonalen Kontraste unerheblich ist.

Gruppe1 Gruppe2 Gruppe3
\(\lambda_{1}\) -2 1 1
\(\lambda_{2}\) 0 -1 1

Oder im Modell ausgedrückt:

\[ \begin{aligned} \hat{Y} &= b_0 + b_1 * (-2) &+ b_2 * (0) \\ \hat{Y} &= b_0 + b_1 * (1) &+ b_2 * (-1) \\ \hat{Y} &= b_0 + b_1 * (1) &+ b_2 * (1) \end{aligned} \]

In R können wir diese Kontraste zunächst als Matrix definieren:

##        [,1] [,2]
## father   -2    0
## mother    1   -1
## other     1    1

Im nächsten Schritt können wir unser Modell berechnen:

## 
## Call:
## lm(formula = Walc ~ guardian, data = student_data)
## 
## Coefficients:
## (Intercept)    guardian1    guardian2  
##     2.24497     -0.04974     -0.10148

Unsere Modelle lauten daher:

\[ \begin{aligned} MODEL\ A &= 2.24497 -0.04974 * X_1 -0.10148 * X_2 \\ MODEL\ C &= 2.291139 \end{aligned} \]

Wir prüfen, ob das Hinzufügen der Mittelwerte der einzelnen Gruppen den Fehler des kompakten Modells substantiell reduziert. Wir prüfen dadurch, ob es Mittelwertunterschied zwischen beiden Gruppen gibt. Wir prüfen dadurch nicht, welche Mittelwerte sich voneinander unterscheiden.

9.7.2 F-Test zur Prüfung der Hypothese

Um diese Hypothese zu prüfen, berechnen wir erneut \(SSE_C\), \(SSE_A\), \(SSR\), \(PRE\), und \(F\). Vorher müssen wir jedoch die Variable guardian in unsere Kontraste überführen:

## Observations: 395
## Variables: 2
## $ x1 <dbl> 1, -2, 1, 1, -2, 1, 1, 1, 1, 1, 1, -…
## $ x2 <dbl> -1, 0, -1, -1, 0, -1, -1, -1, -1, -1…

Als Nächstes prüfen wir die Hypothese durch unseren gängigen F-Test:

## [1] 653.519
## [1] 652.008
## [1] 1.510982
## [1] 0.002312071
## [1] 0.4553748
## [1] 0.6345445

Zudem möchten wir die Effektstärke für dieses Ergebnis berechnen. Bei der einfaktoriellen Varianzanalyse berichtet man in der Regel die Effektgröße \(\eta^2\), welche gleich \(PRE\) ist.

Source SS df MS F p \(\eta^2\)
Reduction 1.510982 2 0.76 0.45 .63 0.002
Error 652.008 392 1.66
Total Error 653.519 394

Unser Ergebnis ist nicht signifikant. Der Guardian scheint keinen Effekt auf den Alkoholkonsum der SuS zu machen.

9.7.3 Alternative orthogonale Kontraste

Wir hatten vorher erwähnt, dass die Art der orthogonalen Kontraste keinen Unterschied auf das Ergebnis macht. Versuchen wir diese Behauptung an dieser Stelle zu prüfen. Hierfür definieren wir zunächst ein neues Set an orthogonalen Kontrasten:

##        [,1] [,2]
## father   -1   -1
## mother    1   -1
## other     0    2

Im nächsten Schritt können wir unser Modell berechnen:

## 
## Call:
## lm(formula = Walc ~ guardian, data = student_data)
## 
## Coefficients:
## (Intercept)    guardian1    guardian2  
##     2.24497     -0.02387     -0.07561

Unsere Modelle lauten daher:

\[ \begin{aligned} MODEL\ A_{alt} &= 2.24497 -0.04974 * X_1 -0.10148 * X_2 \\ MODEL\ A_{neu} &= 2.24497 -0.02387 * X_1 -0.07561 * X_2 \\ MODEL\ C &= 2.291139 \end{aligned} \]

Du siehst, dass sich \(b_1\) und \(b_2\) geändert haben. Dies liegt daran, dass wir unterschiedliche Kontrastgewichte angenommen haben. Im nächsten Schritt führen wir die gleichen Berechnungen durch:

## Observations: 395
## Variables: 2
## $ x1 <dbl> 1, -1, 1, 1, -1, 1, 1, 1, 1, 1, 1, -…
## $ x2 <dbl> -1, -1, -1, -1, -1, -1, -1, -1, -1, …

Als Nächstes prüfen wir die Hypothese durch unseren gängigen F-Test:

## [1] 653.519
## [1] 652.008
## [1] 1.510982
## [1] 0.002312071
## [1] 0.4553748
## [1] 0.6345445

Die Ergebnisse sind exakt die gleichen wie bei den anderen Kontrasten. Dies liegt daran, dass beide Modelle die gleichen Mittelwerte vorhersagen. Beispielsweise liefert die Kontraste der Ausprägung father die gleichen Werte unabhängig der Modelle:

## [1] 2.34445
## [1] 2.34445

Dieser Wert ist nichts anderes als der Mittelwert der Gruppe father:

## [1] 2.344444

9.7.4 Berechnung in Jamovi

Unsere Hypothese können wir einfacher und schneller in Jamovi testen. Hierfür wählst du zunächst ANOVA aus:

Im nächsten Schritt bestimmst du die abhängige und die unabhängige Variable. Zudem gibst du an, dass du die Effekstärke \(\eta^2_p\) ausgegeben bekommen möchest. Ebenso kannst du mit Hilfe von Estimated Marginal Means dir die Mittelwerte der Gruppen mit den Konfidenzintervallen anzeigen lassen:

Anschließend kopierst du den Code und fügst ihn in R ein. Achte wie immer darauf, dass du den Datensatz anpasst (data = student_data):

Zum Vergleich die Ergebnisse sind identisch mit den von uns berechneten Ergebnissen:

Source SS df MS F p \(\eta^2_p\)
Reduction 1.510982 2 0.76 0.45 .63 0.002
Error 652.008 392 1.66
Total Error 653.519 394

9.7.5 Einfaktorielle Varianzanalyse berichten

Möchtest du das Ergebnis in einem Artikel berichten, würdest du folgendes schreiben:

Um unsere Hypothese zu überprüfen, wurde eine einfaktorielle Varianzanalyse mit dem Alkoholkonsum der SuS am Wochenende als abhängige Variable und den Erziehungsberechtigten als unabhängige Variable berechnet. Es ergab sich kein signifikanter Effekt des Faktors Erziehungsberechtigter, F(2, 392) = 0.45, p = .63, \(\eta^2_p\) = 0.002 (kein Effekt). Die Ergebnisse deuten darauf hin, dass die Wahl der Erziehungsberechtigten keinen Effekt auf den Alkoholkonsum der SuS am Wochenende macht.

9.7.6 Zusammenfassung

Bei der einfaktoriellen Varianzanalyse testen wir, ob es Mittelwertunterschiede bei mehreren Gruppen gibt. Um diese Fragestellung zu testen, berechnen wir einen F-Test mit folgenden Modellen:

\[ \begin{aligned} MODEL\ A &= b_0 + b_1 * X_1 + b_2 * X_2 + ... + b_i * X_i \\ MODEL\ C &= b_0 \end{aligned} \]

Ein signifikantes Ergebnis bedeutet, dass es Mittelwertunterschiede gibt. Wir wissen auf Grundlage der Ergebnisse allerdings nicht, welche Mittelwerte sich signifikant voneinander unterscheiden.