5.5 Ziele von Modellen

Ein gutes statistisches Modell ist ein Modell, welches die Fehler klein hält und gleichzeitig nicht zu komplex ist. In der Sozialforschung haben wir fast nie Modelle, bei denen wir Fehler von 0 erhalten. Dennoch möchten wir versuchen, diesen Fehler so klein wie möglich zu halten. Gleichzeitig sollten wir versuchen, nicht zu viele Parameter in das Modell aufzunehmen. Wir müssen daher bei der Aufstellung von Modelle immer an zwei Enden denken. Einerseits sollten wir die Fehler reduzieren, andererseits sollten wir nicht zu komplexe Modelle definieren. Als Folge haben wir ein Problem: Einerseits sollen die Fehler klein gehalten werden, andererseits sollen so wenig Parameter wie möglich verwendet werden!? Deine Aufgabe ist es, die richtige Balance der beiden Ansprüche zu finden. Für jeden Parameter müssen wir uns daher die Frage stellen, ob der Parameter gut genug ist, um den Fehler substantiell zu reduzieren.

Um die Fehler in einem Modell zu reduzieren, können wir verschiedene Methoden anwenden. Erstens können wir dafür sorgen, dass die Daten ohne Fehler erhoben und eingetragen wurden. Manche Menschen machen Fehler, wenn sie Daten in Excel-Tabellen eintragen, manchmal ist ein Verfahren aber auch unreliabel und zeigt inkonsistente Werte an. Beispielsweise kann eine Waage unreliabel sein, wenn sie beim gleichen Gewicht schwankende Werte angibt. Zweitens können wir mehr Parameter in ein statistisches Modell hinzufügen. Je mehr Parameter ein Modell hat, desto geringer wird der Fehler. Für unser erweitertes Modell mit einem Parameter können wir noch maximal 9 weitere Parameter hinzufügen. Mit jedem Parameter reduziert sich der Fehler. Man könnte daher intuitiv annehmen, dass es sinnvoll wäre, möglichst viele Parameter in ein Modell hinzuzunehmen. Dem ist allerdings nicht so, da wir hierdurch kein sparsames Modell mehr hätten.