5.3 Statistische Modellierung

Um eine Hypothese zu prüfen, stellen wir immer zwei Modelle auf, die wir gegeneinander testen. Gerade hatten wir die Hypothese aufgestellt, dass Manager im Schnitt 42 Jahre alt sind. Wir gehen allerdings nicht davon aus, dass diese Hypothese stimmt. Solche Hypothesen, die wir widerlegen möchten, nennen wir Nullhypothesen. Die Hypothese von der wir überzeugt sind, nennen wir Alternativhypothese. Da wir davon ausgehen, dass das Alter der Manager nicht 42 beträgt, nutzen wir den Mittelwert der Stichprobe, um ein zweites Modell aufzustellen. Wir erhalten hierdurch ein kompaktes Modell (Nullhypothese) und ein erweitertes Modell (Alternativhypothese):

\[ \begin{aligned} MODEL_C &= B_0 + \epsilon_i \\ MODEL_A &= \beta_0 + \epsilon_i \end{aligned} \]

Das kompakte Modell (\(MODEL_C\)) hat keine Parameter, da wir \(B_0\) vorgeben und nicht aus den Daten berechnen. Das erweiterte Modell (\(MODEL_A\)) hat einen Parameter (\(\beta_0\)). \(\beta_0\) kennzeichnet den wahren Populationsmittelwert. Wenn wir später den Stichprobenmittelwert berechnen, bezeichnen wir diesen als \(b_0\). \(\epsilon_i\) kennzeichnet den Fehler, den wir auf Grundlage des wahren Populationsmittelwertes unserer abhängigen Variable machen. Diesen Fehler bezeichnen wir \(e_i\), wenn wir von der Stichprobe sprechen. \(B_0\) kennen wir bereits, es ist der vorgegeben Werte des CEOs. \(b_0\) müssen wir berechnen. \(b_0\) steht für Mittelwert des Alters der Stichprobe:

## [1] 44.3

\(b_0\) ist demnach \(44.3\).

In den nächsten Wochen werden wir immer wieder solche Modellpaare aufstellen. Der einzige Unterschied wird darin bestehen, dass diese Modelle komplexer werden. Eine Besonderheit wird zudem darin bestehen, dass wir das erweiterte Modell in unserem Beispiel als kompaktes Modell verwenden werden. In diesem Modul verwenden wir das einfachst mögliche kompakte Modell mit keinem Parameter.

Grafisch können wir unsere beiden Modelle erneut darstellen:

Beide Modelle machen unterschiedliche Fehler. Zum Beispiel ist das kompakte Modell bei der Hervorsage der Person 585 genauer als das erweiterte Modell, da der vertikale Strich zwischen dem realen Wert und dem blauen Strich (dem Modell) kleiner ist. Andererseits scheint das erweiterte Modell bei der Person 1117 akkurater zu sein als das kompakte Modell.