11.4 ANCOVA vs. Differenzmaße

Die Frage, ob sich das Gewicht von Männern und Frauen unterscheidet, wenn man für deren Gewicht vor der Diät kontrolliert ist nicht sonderlich interessant. Viel interessanter wäre die Frage, wie groß der Effekt der Diät ist, wenn wir für das Gewicht vor der Diät kontrollieren. Zur Erinnerung: Die Probanden erhielten eine von drei Diäten und mussten diese sechs Wochen durchziehen.

Wir werden in diesem Abschnitt eine ANCOVA für diese Fragestellung berechnen. Anschließend werden wir zeigen, dass Differenzmaße als abhängige Variable möglich sind, allerdings zu leicht unterschiedlichen Ergebnissen führen und nur begründet verwendet werden sollten.

11.4.1 Berechnung der ANCOVA

Um die Fragestellung zu beantworten, stellen wir unsere Kontrastgewichte auf. Da wir drei Gruppen haben, benötigen wir zwei orthogonale Kontraste:

Diät 1 Diät 2 Diät 3
\(\lambda_{1}\) -1 -1 2
\(\lambda_{2}\) 1 -1 0

Der erste Regressionskoeffizient \(b_1\) testet demnach die Hypothese, dass Diät 3 zu einer größeren Gewichtsreduzierung führt als die anderen Diäten. Der zweite Regressionskoeffizient \(b_2\) testet, ob Diät 1 zu einer größeren Gewichtsreduzierung führt als Diät 2. In das Modell nehmen wir als Kovariate \(Z\) zudem das Gewicht auf, welches die Probanden vor der Diät hatten:

\[ Model_{A} = b_0 + b_1 * X_1 + b_2 * X_2 + b_z * Z \]

Als Nächstes wandeln wir die Variable Diet in einen Faktor um und bestimmen deren Levels:

## [1] "1" "2" "3"

Als nächstes bestimmen wir die Kontrastgewichte des Faktors Diet:

##   [,1] [,2]
## 1   -1    1
## 2   -1   -1
## 3    2    0

Nun können wir unser erweitertes Modell bestimmen:

## 
## Call:
## lm(formula = weight6weeks ~ Diet + pre.weight, data = diet)
## 
## Coefficients:
## (Intercept)        Diet1        Diet2   pre.weight  
##    -2.08307     -0.60413      0.01672      0.97478

\[ Model_{A} = -2.083 -0.604 * X_1 + + 0.017 * X_2 + 0.975 * Z \]

Die F-Tests liefern folgenden Haupteffekt und den Effekt der Kovariate:

Source SS df MS F p
pre.weight 4382.3 1 4382.28 774.35 < .001
Diät 56.3 2 28.15 4.97 0.009
Error 407.5 72 5.66
Total 4870.99 75

Das Gewicht vor der Diät ist demnach hochprediktiv für das Gewicht nach der Diät (F(1, 73) = 774,35). Zudem erkennen wir einen signifikanten Haupteffekt, das bedeutet, die Gewichtsreduzierungen der Gruppen unterscheiden sich. Der Kontrast zwischen Diät 3 und den anderen Diäten ergibt zudem ein signifikantes Ergebnis:

Kontrast Estimate SE t p
3 - 1,2 -1.81 0.575 -3.14 0.002

11.4.2 Berechnung einer ANOVA mit Differenzmaßen

Könnten wir nicht genausogut eine ANOVA berechnen und als abhängige Variable die Gewichtsreduzierung annehmen? Versuchen wir es einmal, indem wir eine neue Variable diff bilden:

## Observations: 76
## Variables: 8
## $ Person       <dbl> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 27, …
## $ gender       <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ Age          <dbl> 22, 46, 55, 33, 50, 50, 37, 28, 28, 45, 60, 48, 41,…
## $ Height       <dbl> 159, 192, 170, 171, 170, 201, 174, 176, 165, 165, 1…
## $ pre.weight   <dbl> 58, 60, 64, 64, 65, 66, 67, 69, 70, 70, 72, 72, 72,…
## $ Diet         <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, …
## $ weight6weeks <dbl> 54.2, 54.0, 63.3, 61.1, 62.2, 64.0, 65.0, 60.5, 68.…
## $ diff         <dbl> -3.8, -6.0, -0.7, -2.9, -2.8, -2.0, -2.0, -8.5, -1.…

Mit dem Differenzwert als abhängige Variable würden wir nun folgendes Modell erhalten:

## 
## Call:
## lm(formula = diff ~ Diet, data = diet)
## 
## Coefficients:
## (Intercept)        Diet1        Diet2  
##     -3.9054      -0.6214      -0.0160

\[ \hat{Y}_i - Z_i = -3.91 - 0.621 * X_1 - 0.016 * X_2 \]

Die F-Tests ergibt folgenden Haupteffekt und den Effekt der Kovariate ergeben:

Source SS df MS F p
Diät 60.5 2 30.26 5.38 0.007
Error 410.4 73 5.62
Total 4870.99 75

Verglichen mit unserer einfaktoriellen Varianzanalyse ergeben sich ein paar Unterschiede:

Source SS df MS F p
pre.weight 4382.3 1 4382.28 774.35 < .001
Diät 56.3 2 28.15 4.97 0.009
Error 407.5 72 5.66
Total 4870.99 75

Zum einen sind die Freiheitsgrade des Errors in der ANCOVA um einen Wert kleiner als in der ANOVA. Dies liegt an dem zusätzlichen Prädiktor \(Z\). Wir erkennen ebenso, dass die Quadratsumme des Fehlers bei der ANCOVA kleiner ist als bei der ANOVA. Dies liegt daran, dass jeder weitere Prädiktor zu einer stärkeren Reduzierung des Fehlers führt. Die Ergebnisse der ANCOVA und der ANOVA sind ansonsten relativ ähnlich. In der Regel ist eine ANCOVA einer ANOVA mit Differenzmaßen vorzuziehen, da die Teststärke hierdurch erhöht wird. Für statistische Laien ist es allerdings manchmal sinnvoller, Differenzwerte zu berechnen, da die Interpretation der Daten hierdurch einfacher wird.