9.1 Kontraste

Um kategoriale Prädiktoren in unser Modell einzufügen, müssen wir Prädiktoren numerische Werte zuordnen. Anders ausgedrückt: Wir müssen einen Weg finden, Kategorien wie beispielsweise auf dem Land wohnen bzw. in der Stadt wohnen, in numerische Werte umzuwandeln. Tatsächlich können wir dies tun, indem wir diesen Kategorien beliebige numerische Werte zuordnen. Beispielsweise könnten wir den SuS, die auf dem Land wohnen, den Wert 1 zuordnen und den SuS, die in der Stadt wohnen den Wert -1 zuordnen. Genausogut könnten wir SuS, die auf dem Land wohnen, den Wert 289 zuordnen und SuS, die in der Stadt wohnen den Wert 5 zuordnen. Wir bezeichnen die numerische Zuordnung von Kategorien zu Zahlen als Kontrastgewichte. Wir werden im folgenden von Kontrastgewichten sprechen, wenn folgendes gilt:

\[ \sum_k \lambda_k = 0 \]

\(\lambda_k\) steht für die einzelnen Kontrastgewichte (z.B. -1). In anderen Worten: Die Summe der Kontrastgewichte sollte 0 ergeben. Daraus schließt sich, dass die Kontrastgewichte -1 und 1 gültig sind, die Kontrastgewichte 289 und 5 hingegen nicht, da ihre Summe nicht 0 ergibt. Tabellarisch können wir diese Kontrastgewichte folgendermaßen angeben.

Contrast Gruppe Land Gruppe Stadt
\(\lambda_{1}\) 1 -1

Achte darauf, dass wir hier die Kontrastgewichte der Anzahl der Kategorien summieren, nicht der einzelnen Personen. Die macht einen deutlichen Unterschied, sofern die Gruppengröße der einzelnen Kategorien unterschiedlich ist. Achte auch darauf, dass die Kontrastgewichte bei zwei Kategorien von -5 und 5 ebenso gültig sind, da auch ihre Summe 0 ergibt.

Ein erweitertes Modell mit kategorialen Prädiktoren benötigt immer \(k - 1\) Prädiktoren. Wenn wir beispielsweise prüfen, ob Schüler*innen, die auf dem Land wohnen mehr Alkohol trinken als Schüler*innen, die in der Stadt wohnen, benötigen wir einen Prädiktor, da wir zwei Gruppen miteinander vergleichen.

\[ Y_i = \beta_0 + \beta_1 * X_1 + \epsilon_i \]

Für den Prädiktor \(X_1\) setzen wir unsere Kontrastgewichte ein:

\[ \begin{aligned} Y_i =& \beta_0 + \beta_1 * 1 + \epsilon_i \\ Y_i =& \beta_0 + \beta_1 * (-1) + \epsilon_i \end{aligned} \]