7 Einfache lineare Regression

In diesem Modul lernen wir Zusammenhangshypothesen zu testen. Beispielsweise werden wir am Ende dieses Moduls in der Lage sein, zu prüfen, ob es einen signifikanten Zusammenhang zwischen der Anzahl der Arbeitsjahre von Mitarbeitern und ihrem monatlichen Gehalt gibt. Modelle, wir wir für solche Hypothesen verwenden nennen wir lineare Regressionsmodelle. Lineare Regressionsmodelle führen das Konzept von Prädiktoren ein, die wir bisher noch nicht besprochen hatten. Prädiktoren sind Variablen, deren Werte sich von Person zu Person unterscheiden. Beispielsweise unterscheidet sich die Anzahl der Arbeitsjahre der Mitarbeiter. Die Anzahl der Arbeitsjahre der Mitarbeiter nennen wir innerhalb der linearen Regression daher Prädiktor. Die lineare Regression ist eines von drei Modellen, die kontinuierliche Prädiktoren annehmen. Als kontinuierliche Prädiktoren bezeichnen wir Prädiktoren mit unendlichen vielen Ausprägungen. Zum Beispiel ist die Anzahl der Arbeitsjahre der Mitarbeiter kontinuierlich, da es unendlich viele Werte zwischen zwei Altersangaben gibt (z.B. 5.4 Jahre und 5.41 Jahre usw.).

In diesem Modul führen wir zudem das Konzept der Konfidenzintervalle ein. Konfidenzintervalle ermöglichen uns nicht nur die Prüfung der Signifikanz einzelner Paramter, sondern erlauben uns auch eine Schätzung über die wahren Populationsparameter abzugeben. Konfidenzintervalle erlauben uns daher eine Einschätzung über die mögliche Größe eines Parameters, beispielsweise in Form der Korrelation zweier Variablen in der Population.