10.3 Interaktionen

Interaktionen sind Kontraste, die aus dem Produkt anderer Kontraste entstehen. Kontraste helfen uns zu verstehen, ob Effekte, die wir durch andere Kontraste finden, von den Ausprägungen anderer Faktoren abhängig sind. Gehen wir ein paar Beispiele durch:

  • Es könnte sein, dass die Wirksamkeit einer Lernstrategie abhängig von dem Vorwissen von Lernenden ist. Lernende mit hohem Vorwissen profitieren von einer Lernstrategie, Lernende ohne Vorwissen profitieren nicht von einer Lernstrategie.
  • In der Natur interagiert die Wirksamkeit von Düngersorten abhängig davon, ob der Dünger im Winter oder im Frühjahr zugegeben wird. Da Pflanzen im Winter kaum wachsen, wirkt der Dünger im Winter nicht, im Sommer aber schon.
  • Es könnte zudem sein, dass die Wirksamkeit verschiedener Diäten abhängig vom Geschlecht der Personen ist. Während Diät 3 bei Männern wirksamer ist als Diät 2 und Diät 1, findet man diesen Effekt bei Frauen nicht.

Interaktionen erlauben uns daher spezifischere Fragen an den Datensatz zu stellen und Grenzbedingungen für Effekte aufzustellen. Wir werden in diesem Teil versuchen, Interaktionen anhand des linearen Modells genauer zu verstehen.

10.3.1 Haupteffekte und spezifische Kontraste

Zunächst beginnen wir mit der einfacheren Interpretation der Haupteffekte. Das Verfahren zur Prüfung von Haupteffekten unterscheidet sich nicht von unserem Vorgehen der vorherigen Modulen. Wir erstellen zwei Modelle (erweitert und kompakt) und prüfen anhand eines F-Tests, ob zusätzliche Parameter die Fehler überdurchschnittlich reduzieren. Da die Koeffizienten dieser Parameter eine konkrete Interpretation zulassen, können wir hierdurch statistische Fragestellungen beantworten. Beispielsweise konnten wir beim t-Test für unabhängige Stichproben Mittelwertunterschiede testen, da der Koeffizient \(b_1\) die Mittelwertunterschiede repräsentiert. Haupteffekte wiederum prüfen wir, indem wir alle Kontraste aus dem erweiterten Modell entfernen, die Unterschiede in den Ausprägungen eines Faktors testen:

Contrast Fragestellung \(D_1 M\) \(D_2 M\) \(D_3 M\) \(D_1 F\) \(D_2 F\) \(D_3 F\)
\(\lambda_{1}\) Diät 1/2 vs. Diät 3 1 1 -2 1 1 -2
\(\lambda_{2}\) Diät1 vs. Diät 2 1 -1 0 1 -1 0
\(\lambda_{3}\) Männer vs. Frauen 1 1 1 -1 -1 -1
\(\lambda_{4}\) Interaktion \(\lambda_{1}\) und \(\lambda_{3}\) 1 1 -2 -1 -1 2
\(\lambda_{5}\) Interaktion \(\lambda_{2}\) und \(\lambda_{3}\) 1 -1 0 -1 1 0

Dieses folgende Modellpaar beispielsweise prüft, ob sich die Diäten in ihrer Wirksamkeit voneinander unterscheiden. Da zwei Kontraste die Wirksamkeit der Diäten beschreiben, entfernen wir diese im kompakten Modell, um den Haupteffekt der Diät zu prüfen:

\[ \begin{aligned} Model_{A} &= b_0 + b_1 * X_1 + b_2 * X_2 &+ b_3 * X_3 + b_4 *X_4 + b_5 * X_5 \\ Model_{C} &= b_0 &+ b_3 * X_3 + b_4 *X_4 + b_5 * X_5 \end{aligned} \]

Spezifische Kontraste ermöglichen uns die Überprüfung spezifischer Hypothesen. Beispielsweise der Frage, ob Diät 3 besser ist als Diät 1 und 2?

\[ \begin{aligned} \hat{Y} &= b_0 + b_1 * X_1 &+ b_2 * X_2 + b_3 * X_3 + b_4 * X_4 + b_5 * X_5 \\ \hat{Y} &= b_0 &+ b_2 * X_2 + b_3 * X_3 + b_4 * X_4 + b_5 * X_5 \end{aligned} \]

10.3.2 Betakoeffizienten bei Interaktionen

Ungleich schwieriger zu verstehen ist, was die Parameter bei Interaktionen bedeuten. Schauen wir uns hierfür den Kontrast \(\lambda_{4}\) an:

Contrast Fragestellung \(D_1 M\) \(D_2 M\) \(D_3 M\) \(D_1 F\) \(D_2 F\) \(D_3 F\)
\(\lambda_{1}\) Diät 1/2 vs. Diät 3 1 1 -2 1 1 -2
\(\lambda_{3}\) Männer vs. Frauen 1 1 1 -1 -1 -1
\(\lambda_{4}\) Interaktion \(\lambda_{1}\) und \(\lambda_{3}\) 1 1 -2 -1 -1 2
\(\lambda_{4}\) Interaktion \(\lambda_{1}\) und \(\lambda_{3}\) \(1 * 1\) \(1*1\) \(1 * (-2)\) \(1 * (-1)\) \(1 * (-1)\) \((-2) * (-1)\)

Formal wissen wir, dass die Kontrastgewichte die Multiplikation anderer Kontraste sind. Versuchen wir als Nächstes den Betakoeffizienten für den Kontrast zu berechnen:

\[ b = \frac{\sum_k{\lambda_k * \bar{Y}_k}}{\sum_k \lambda_k^2} \]

Zunächst müssen wir die Mittelwerte der Gruppen ermitteln:

Diet gender mean
1 0 -3.050000
1 1 -3.650000
2 0 -2.607143
2 1 -4.109091
3 0 -5.880000
3 1 -4.233333

Anhand dieser Mittelwerte können wir nun den Betakoeffizienten berechnen:

## [1] -0.4496068

Der Betakoeffizienten des ganzen Modells lauten:

## # A tibble: 76 x 6
##     diff    x1    x2    x3    x4    x5
##    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 -3.80     1     1    -1    -1    -1
##  2 -6        1     1    -1    -1    -1
##  3 -0.7      1     1    -1    -1    -1
##  4 -2.90     1     1    -1    -1    -1
##  5 -2.80     1     1    -1    -1    -1
##  6 -2        1     1    -1    -1    -1
##  7 -2        1     1    -1    -1    -1
##  8 -8.5      1     1    -1    -1    -1
##  9 -1.9      1     1    -1    -1    -1
## 10 -3.10     1     1    -1    -1    -1
## # … with 66 more rows

Wir haben nun die Kontrastgewichte für unser erweitertes Modell in einen Dataframe umgewandelt. Diese Kontraste können wir anschließend der Funktion lm übergeben, um die Parameter zu berechnen:

## 
## Call:
## lm(formula = diff ~ x1 + x2 + x3 + x4 + x5, data = model_matrix_diet)
## 
## Coefficients:
## (Intercept)           x1           x2           x3           x4  
##   -3.921595     0.567536     0.004058    -0.075880    -0.449607  
##          x5  
##    0.225487

Daraus ergibt sich folgendes Modell:

\[ Y_i = -3.92 + 0.567 * X_1 + 0.004 * X_2 -0.076 * X_3 -0.449 * X_4 + 0.225 * X_5 \]

10.3.3 Bedeutung des Betakoeffizienten des Kontrasts \(\lambda_{1}\)

Um zu verstehen, was der Betakoeffizient der Interaktion bedeutet, hilft es, zunächst das einfachere Beispiel des Kontrasts \(\lambda_{1}\) durchzugehen:

Contrast Fragestellung \(D_1 M\) \(D_2 M\) \(D_3 M\) \(D_1 F\) \(D_2 F\) \(D_3 F\)
\(\lambda_{1}\) Diät 1/2 vs. Diät 3 1 1 -2 1 1 -2

Der Koeffizient \(0.567\) steht für den Mittelwertunterschied zwischen den Gruppen Diät1 und Diät2 und der Gruppe 3. Wir prüfen anhand dieses Kontrastes dementsprechend, ob Diät 3 zu einer größeren Gewichtsreduzierung führt als die anderen beiden Diäten. Um diese Behauptung zu unterstützen, formulieren wir die Berechnung des Betakoeffizienten um:

\[ b = \frac{\sum_k{\lambda_k * \bar{Y}_k}}{\sum_k \lambda_k^2} \]

Für unsere Hypothese Diät3 vs. Diet1/2 lautet der Koeffizient:

\[ \begin{aligned} b_1 &= \frac{((1 * -3.65) + (1 * -4.109091) + (-2 * -4.233333) + (1 * -3.05) + (1 * -2.607143) + (-2 * -5.88)))}{12} = 0 \\ b_1 &= \frac{((1 * \bar{X}_{1M}) + (1 * \bar{X}_{2M}) + (-2 * \bar{X}_{3M}) + (1 * \bar{X}_{1W}) + (1 * \bar{X}_{2W}) + (-2 * \bar{X}_{3W})))}{12} = 0 \end{aligned} \]

Durch ein wenig Algebra können wir den Koeffizienten in folgende Form umwandeln:

\[ \bar{X}_{1M} + \bar{X}_{1W} + \bar{X}_{2M} + \bar{X}_{2W} = 2 * (\bar{X}_{3M} + \bar{X}_{3W}) \]

Anschließend teilen wir jede Seite durch 2:

\[ \frac{\bar{X}_{1M} + \bar{X}_{1M}}{2} + \frac{\bar{X}_{2W} + \bar{X}_{2W}}{2} = 2 * \frac{(\bar{X}_{3M} + \bar{X}_{3W})}{2} \]

  • \(\frac{\bar{X}_{1M} + \bar{X}_{2M}}{2}\) ist nichts anderes als der Mittelwert der Menschen, die Diät 1 erhalten haben.
  • \(\frac{\bar{X}_{1W} + \bar{X}_{2W}}{2}\) ist der Mittelwert der Menschen, die Diät 2 erhalten haben.
  • \(\frac{\bar{X}_{3M} + \bar{X}_{3W}}{2}\) ist der Mittelwert der Menschen, die Diät 3 erhalten haben. Demnach können wir die Gleichung umformulieren, indem wir diese Berechnungen als Mittelwerte der Gruppen angeben:

\[ \bar{X}_{1} + \bar{X}_{2} = 2 * \bar{X}_{3} \]

Der Koeffizient prüft demnach nichts anderes als die Frage, ob der Mittelwert der Gruppe 3 gleich dem Mittelwert der anderen beiden Diätgruppen ist:

\[ \frac{\bar{X}_{1} + \bar{X}_{2}}{2} = \bar{X}_{3} \]

Um den Betakoeffizienten der Interaktion durchzugehen, werden wir nun ähnlich vorgehen.

10.3.4 Bedeutung des Betakoeffizienten des Kontrasts \(\lambda_{4}\)

Wenden wir das gleiche Prinzip auf die erste Interaktion \(\lambda_{4}\) an. Die Interaktion prüft, ob der Effekt Diet 3 vs. Diet1/2 abhängig davon ist, ob die Diäten Männer oder Frauen erhalten.

Contrast Fragestellung \(D_1 M\) \(D_2 M\) \(D_3 M\) \(D_1 F\) \(D_2 F\) \(D_3 F\)
\(\lambda_{4}\) Interaktion \(\lambda_{1}\) und \(\lambda_{3}\) 1 1 -2 -1 -1 2

Der Parameter \(b_4\) berechnet sich folgendermaßen:

\[ b_4 = \frac{(1 * \bar{X}_{1M}) + (1 * \bar{X}_{2M}) + (-2 * \bar{X}_{3M}) + (-1 * \bar{X}_{1W}) + (-1 * \bar{X}_{2W}) + (2 * \bar{X}_{3W})}{12} = 0 \]

Umgerechnet ergibt dies:

\[ \frac{\bar{X}_{1M} + \bar{X}_{2M} - 2* \bar{X}_{3M}}{12} = \frac{\bar{X}_{1W} + \bar{X}_{2W} - 2 * \bar{X}_{3W}}{12} \]

Indem wir den Zähler und den Nenner jeweils durch 2 teilen, erhalten wir:

\[ \frac{1}{6} * (\frac{\bar{X}_{1M} + \bar{X}_{2M}}{2} - \bar{X}_{3M}) = \frac{1}{6} * (\frac{\bar{X}_{1W} + \bar{X}_{2W}}{2} - \bar{X}_{3W}) \]

Du siehst nun, dass in den Klammern die gleiche Frage ist, die wir uns bei \(\lambda_{1}\) gestellt haben. Ist Diät 3 effektiver als Diät 1 und Diät 2?

\[ \frac{\bar{X}_{2} + \bar{X}_{2}}{2} = \bar{X}_{3} \]

Diesmal allerdings fragen wir uns, ob der Unterschied dieser Diäten bei Männer und Frauen gleich ist?

\[ \bar{X}_{1M} + \bar{X}_{2M} = \bar{X}_{1W} + \bar{X}_{2W} \]

Und genau für diese Frage steht der Koeffizient \(b_4\). Bei der Nullhypothese gehen wir davon aus, dass es keinen Unterschied zwischen dieser Differenz gibt:

\[ \begin{aligned} Model_{A} &= b_0 + b_1 * X_1 + b_2 * X_2 + b_3 * X_3 + b_4 * X_4 &+ b_5 * X_5 \\ Model_{C} &= b_0 + b_1 * X_1 + b_2 * X_2 + b_3 * X_3 + 0 * X_4 &+ b_5 * X_5 \end{aligned} \]

Sobald der F-Test signifikant ist, gehen wir davon aus, dass der Effekt der Diät 3 vs. Diät 1/2 bei Männern und Frauen unterschiedlich ist. In diesem Fall berechnen wir Simple Effects, um heraus zu finden, worin dieser Unterschied besteht.

10.3.5 Visualisierung

Um ein besseres Verständnis für Interaktionen zu erhalten, ist es häufig ratsam eine Visualisierung der Mittelwerte anzuschauen. Die Visualisierung sollte so aussehen, dass auf der X-Achse die Diät repräsentiert ist und auf der Y-Achse die Gewichtsreduzierung. Einzelne Linien kennzeichnen das Geschlecht. Zunächst müssen wir das Differenzmaß der Gewichtsreduzierung berechnen und die Faktoren in Faktoren in R umrechnen:

## Observations: 78
## Variables: 8
## $ Person       <dbl> 25, 26, 1, 2, 3,…
## $ gender       <fct> NA, NA, 0, 0, 0,…
## $ Age          <dbl> 41, 32, 22, 46, …
## $ Height       <dbl> 171, 174, 159, 1…
## $ pre.weight   <dbl> 60, 103, 58, 60,…
## $ Diet         <fct> 2, 2, 1, 1, 1, 1…
## $ weight6weeks <dbl> 60.0, 103.0, 54.…
## $ diff         <dbl> 0.0, 0.0, -3.8, …

Als Nächstes berechnen wir die Mittelwerte der einzelnen Gruppen:

Und visualisieren die Gruppenmittelwerte:

Tatsächlich, bei Frauen scheint der Effekt der Diät 3 deutlich besser zu wirken als bei den Männern. Um diese Intuition zu prüfen, berechnen wir nach einer signifikanten Interaktion Simple Effects.

10.3.6 Simple Effects und Post-Hoc Analysen

Interaktionen sagen uns lediglich, dass es einen Unterschied bei einem Effekt abhängig der Ausprägung eines anderen Faktors sind. Sie sagen uns allerdings nicht, worin dieser Unterschied besteht. Hierfür berechnen wir entweder Simple Effects oder Post-Hoc Tests.

Simple Effects sind nichts anderes als Varianzanalysen, die wir für mehrere Ausprägungen eines Faktors berechnen. Beispielsweise könnten wir den Kontrast Diät 3 vs. Diät 1/2 jeweils in einer einfaktoriellen Varianzanalyse bei Männern und bei Frauen testen.

Bei Post-Hoc Tests vergleichen wir in der Regel alle möglichen Gruppenpaare miteinander und prüfen diese nach Signifikanz. Oder anders ausgedrückt: Wir rechnen für jedes Gruppenpaar einen t-Test und korrigieren das Alpha-Niveau um eine Inflation des Fehlers 1. Art zu vermeiden. Wir werden später im ausführlichen Beispiel darauf zurückkommen.

Achte zudem darauf, dass bei Interaktionen die Haupteffekte nicht interpretierbar sind, da die Haupteffekte von den Ausprägungen eines anderen Faktors abhängig sind. Es ist daher immer ratsam bei Interaktionen die Simple Effects zu berichten und den Haupteffekt nicht zu interpretieren.