11.1 ANOVA vs. ANCOVA

Stell dir vor, wir möchten heraus finden, ob das Gewicht von Männern und Frauen unterschiedlich ist. Hierfür würden wir das Gewicht von Frauen und Männern erfragen und anschließend eine einfaktorielle Varianzanalyse des Faktors Geschlecht berechnen. Da das Geschlecht in unserem Beispiel lediglich zwei Ausprägungen hat (männlich und weiblich), benötigen wir nur einen Prädiktor in unserem erweiterten Modell:

\[ \hat{Y} = b_0 + b_1 * X_1 \]

Das Geschlecht kodieren wir mit den Kontrastgewichten 1 und -1 und setzen diese für \(X_1\) ein. Als abhängige Variable nehmen wir das Geschlecht der Probanden sechs Wochen nachdem sie eine Diät begonnen haben. Um zu prüfen, ob der Geschlechtsunterschied besteht, berechnen wir einen F-Test mit folgenden Modellen:

\[ \begin{aligned} Model_{A} &= 69.119 - 5.896 * X_1 \\ Model_{C} &= 68.34 \end{aligned} \]

Um die Frage zu prüfen, verwenden wir den Diät Datensatz aus unserem vorherigen Modul:

Anschließend berechnen wir eine einfaktorielle Varianzanalyse mit Jamovi und lassen uns die Ergebnisse ausgeben:

## 
##  ANOVA
## 
##  ANOVA                                                                  
##  ---------------------------------------------------------------------- 
##                 Sum of Squares    df    Mean Square    F       p        
##  ---------------------------------------------------------------------- 
##    gender                 2596     1         2596.2    84.5    < .001   
##    Residuals              2275    74           30.7                     
##  ----------------------------------------------------------------------

Wir erhalten einen signifikanten Effekt des Geschlechts. Männer wiegen deutlich mehr als Frauen. Der F-Wert ist extrem hoch und die Wahrscheinlichkeit für diese Unterschiede unter der Nullhypothese, dass es keine Unterschiede gibt, ist äußerst gering.

Der Lesbarkeit halber stellen wir die Ergebnisse als Tabelle dar:

Source SS df MS F p
Faktor Geschlecht 2596 1 2596.2 84.5 p < .001
Error 2275 74 30.7
Total 4871 75

Stell dir als Nächstes vor, wir möchten prüfen, ob sich das Gewicht von Männern und Frauen unterscheidet, wenn wir für deren Gewicht sechs Wochen vor der Messung kontrollieren. In anderen Worten fragen wir uns, ob der Gewichtsunterschied zwischen Männern und Frauen immer noch besteht, wenn wir deren Gewicht vor der Diät in das Modell integrieren. Die Frage ist gleichbedeutent mit der Frage, ob die Diäten nach den sechs Wochen abhängig vom Geschlecht unterschiedlch wirken. Wir wissen bereits vor der Diät, dass Männer mehr wiegen als Frauen. Wenn wir diese Unterschiede nicht in unser Modell integrieren würden, testen wir nicht wirklich den Effekt der Diät, sondern vielmehr die natürlichen Gewichtsunterschiede zwischen Mann und Frau.

Um diese alternative Hypothese zu prüfen, fügen wir das Gewicht der Probanden sechs Wochen vor deren Diät in unser Modell als kontinuierliche Variable ein und bezeichnen diese Variable als \(Z\). In anderen Worten, wir kontrollieren für das Gewicht vor der Diät:

\[ \begin{aligned} Model_{A} &= b_0 + b_1 * X_1 &+ b_z * Z \\ Model_{C} &= b_0 &+ b_z * Z \end{aligned} \]

Berechnet ergibt sich folgendes Modell:

\[ \begin{aligned} Model_{A} &= 1.4804 - 0.382 * X_1 + 0.9256 * Z \\ Model_{C} &= 68.34 \end{aligned} \]

Im Vergleich zu unserem Modell ohne die Kovariate Z haben sich nun die Koeffizienten geändert:

\[ \begin{aligned} Model_{A\ mit\ Z} &= 1.4804 - 0.382 * X_1 + 0.9256 * Z \\ Model_{A\ ohne\ Z} &= 69.119 - 5.896 * X_1 \end{aligned} \]

Beide Modell unterscheiden sich in mehreren Punkten:

  • Das Modell mit \(Z\) hat einen Prädiktor mehr als das Modell ohne \(Z\).
  • Die Koeffizienten der Modelle ändern sich aufgrund der Kovariate.

Das Ergebnis der ANCOVA sehen folgendermaßen aus:

Source SS df MS F p
Faktor Geschlecht 4.84 1 4.84 0.770 .38
\(pre_{weight}\) 1815.87 1 1815.87 288.84 < .001
Error 458.93 73 6.29
Total 4871 75

Verglichen mit der einfaktoriellen Varianzanalyse sehen wir ein paar wesentliche Unterschiede:

Source SS df MS F p
Faktor Geschlecht 2596 1 2596.2 84.5 p < .001
Error 2275 74 30.7
Total 4871 75
  • Die Quadratsummen der Fehler im erweiterten Modell sind in der ANCOVA deutlich geringer als bei der ANOVA. Dies liegt daran, dass wir einerseits einen weiteren Parameter in das erweiterte Modell hinzugefügt haben und hierdurch die Fehler automatisch reduzieren als auch darin, dass der Prädiktor \(pre_{weight}\) den Fehler deutlich reduziert.
  • Der Freiheitsgrad der Fehler ist bei der ANCOVA um einen Wert geringer als bei der ANOVA. dies liegt daran, dass unser erweitertes Modell einen Parameter (\(Z\)) mehr hat als bei der ANOVA (\(n - PA\)).
  • Der Gruppenunterschied zwischen Männern und Frauen ist bei der ANOVA nicht mehr signifikant. Der Grund hierfür liegt darin, dass das Gewicht vor der Diät bereits hoch prediktiv für das Gewicht nach der Diät ist und das Geschlecht nur noch wenig beiträgt, wenn für das Gewicht vor der Diät kontrolliert wird.

Wir können demnach zeigen, dass der Effekt des Geschlechts verschwindet, wenn wir für das Gewicht vor der Diät kontrollieren. ANCOVAs können uns daher eine genauere Einschätzung eines Effekts unter dem Einbezug einer anderen kontinuierlichen Variable geben.