12.3 Abhängigkeit

Aus den Daten allein können wir nicht sagen, ob die Abhängigkeit durch eine Gruppierung oder durch sequentielle Messzeitpunkte geschieht. Es ist unser Versuchsdesign, welches uns Hinweise liefert, welche Abhängigkeit vorherrscht. Wir bezeichnen diese Abhängigkeiten gleich als gekreuzte Daten und als genestete Daten.

12.3.1 Gekreuzte Daten

In diesem Modul werden wir uns auf gekreuzte Daten (Crossed Daten) konzentrieren. Normalerweise treten gekreuzte Daten auf, wenn wir Daten einer Versuchsperson mehrmals erheben. Wir haben gerade eben bereits das Beispiel des Cholesterins kennen gelernt. Der Cholesterinspiegel von Probanden wird mehrmals gemessen. Stell dir ein anderes Beispiel vor: Du möchtest untersuchen, ob eine bestimmte Übung einen Einfluss darauf hat, wie schnell Probanden in einen Meditationszustand kommen. Du gehst davon aus, dass Probanden, die diese Übung über längere Zeit durchführen, schneller in einen Meditationszustand kommen. Alle Probanden führen die Übung über drei Wochen durch. Du testest die Dauer bis die Probanden in den Meditationszustand kommen je einmal wöchentlich. Folgende Ergebnisse erhälst du:

id week0 week1 week2
1 140 130 100
2 90 100 70
3 160 140 120
4 250 230 210
5 30 40 20
6 400 390 340

Zunächst kannst du anhand der Tabelle erkennen, dass die Probanden im Schnitt über die Wochen schneller in den Meditationszustand kommen. Die Probandin mit der ID 4 zum Beispiel benötigt am Anfang 250 Sekunden, dann 230 Sekunden, dann 210 Sekunden. Ebenso erkennst du, dass die Daten abhängig voneinander sind. Beispielsweise fällt auf, dass die Werte der Probandin mit der ID 4 relativ hoch bleiben, wenn wir sie mit der Probandin mit der ID 2 vergleichen. Wer bereits lange Zeit beim ersten Messzeitpunkt benötigt, wird auch beim nächsten Messzeitpunkt mehr Zeit benötigen.

Wan sind die Daten allerdings gekreuzt? Wir sprechen von gekreuzten Daten, wenn die Werte einzelner Personen in verschiedenen Ausprägungen eines Faktors vorliegen. In diesem Fall haben wir den Faktor Zeitpunkt, mit drei Ausprägungen (week0, week1 und week2). Für jeden Proband liegt ein Wert in jeder Ausprägung vor. Die Daten wären nicht gekreuzt, wenn Daten nur in einer Ausprägung eines Faktors vorlägen. Stell dir zum Beispiel mehrere Schulklassen vor, die unterschiedliche Lernstrategien erhalten. Schulklasse A, B und C erhalten Lernstrategie X nd Schulklasse D, E und F erhalten Lernstrategie Y. Die Abhängigkeit der Daten entsteht dadurch, dass die Schüler jeweils in der gleichen Klasse stecken. Diese Daten sind nicht gekreuzt, da die Schüler nur in je einer Ausprägung des Faktors Lernstrategie stecken.

Ein anderes Beispiel: Du möchtest prüfen, ob sich das Verhalten von Schülern ändert, wenn man ihnen öfters Lob gibt. Bisher hätten wir solche Fragestellungen getestet, indem wir zwei unabhängige Gruppe umgesetzt hätten, welche entweder gelobt werden oder nicht gelobt werden. Durch ein solches Design könnten wir allerdings nicht prüfen, ob Lob über die Zeit zu einer Veränderung des Verhaltens der Schüler führt. In deinem neuen Design gibst du daher allen Schülern über fünf Messzeitpunkte Lob. Erneut sind die Daten gekreuzt, da für jede Ausprägung des Faktors Messzeitpunkt ein Datenpunkt je eines Schülers / einer Schülerin steckt.

In den Lehrbüchern spricht man in der Regel von Messwiederholungsdesigns. Diese sind in der einfachsten Form immer dadurch erkennbar, dass die Daten gekreuzt sind. Wir werden der Vollständigkeit nun einen weiteren Fall der Abhängigkeit kennen lernen, bei dem die Daten genested bzw. hierarchisch strukturiert sind.

12.3.2 Genestete Daten

Wir hatten genestete Daten bereits mit unserem Schulklassenbeispiel kennen gelernt. Schüler*innen innerhalb einer Schulklasse erhalten entweder die Lernstrategie X oder die Lernstrategie Y. Genestete Daten zeichnen sich dadurch aus, dass die Probanden bzw. Datenpunkte nur in einer Ausprägung eines Faktors vorliegen. In diesem Fall erhalten die Schüler*innen der jeweiligen Gruppen nur eine der beiden Lernstrategien. Diese Aussage gilt nur für den Fall, wenn wir entweder gekreuzte oder genestete Daten vorliegen haben. Es gibt auch Designs, die beide Strukturen beinhalten. Über diese Designs werden wir allerdings in diesem Modul nicht sprechen.

Wir können ebenso das Beispiel der Schulklassen visualisieren:

Treatment X
Treatment Y
y KlasseA KlasseB KlasseC KlasselD KlasseE KlasseF
y_1i 7 9 5 10 8 6
y_2i 3 8 4 11 7 3
y_3i 2 10 3 12 8 4
y_4i 5 7 6 13 7 5

In der Tabelle kannst du erkennen, dass die Schüler innerhalb einer Schule immer nur entweder Treatment X oder Treatment Y bekommen. Die Daten sind daher nicht gekreuzt. Allerdings sind die Daten unter dem Faktor der Schulklasse genested, die sich Schüler innerhalb einer Klasse ähnlich sind. Manche Klassen sind im Schnitt besser als die anderen Klassen. Hierdurch wissen wir, dass beispielsweise eine Schülerin aus KlasseA, die sehr gut ist, vermutlich besser sein wird, als eine Schülerin aus Klasse B, die etwas schlechter ist.

Genestete Daten finden sich sehr häufig in großen Schulstudien, in denen Erhebungen in Klassen erhoben werden. Stell dir beispielsweise die PISA-Studie vor, in der nicht nur Klassen, sondern auch Schulen genested vorliegen können. Die statistischen Verfahren in solchen Designs werden zunehmend komplexer.

12.3.3 Folgen gekreuzter und genesteter Daten für die Power

Ignoriert man die gekreuzte oder genestete Struktur von Daten, hat dies Einfluss auf den F-Wert und damit auch auf die Power einer Studie. Verletzung der Annahme der Unabhnägigkeit sind die gravierendsten und sollten auf jeden Fall beachtet werden, wenn man die Daten mit Hilfe verschiedener statistischer Verfahren auswertet. Eine Übersicht der Auswirkungen siehst du in der folgenden Tabelle:

Art der Abhängigkeit
Gruppe positiv negativ
Genestete Daten F zu groß F zu klein
Gekreuzte Daten F zu klein F zu groß

Stell dir ein Beispiel vor: Du möchtest eine Messwiederholungsanalyse mit gekreuzten Daten rechnen. Innerhalb der Daten herrscht eine positive Abhängigkeit. Beispielsweise indem die Entwicklung der intrinsischen Motivation von Studenten über eine längere Zeit testest. Wer am Anfang intrinsisch motiviert ist, wird wohl auch später intrinsisch motiviert sein. Verletzt du nun die Annahme der Abhängigkeit und berechnest statt einer Messwiederholungsanalyse eine einfaktorielle Varianzanalyse erhälst du in der Regel einen zu kleinen F-Wert. Dies bedeutet, du bist mit einer geringeren Wahrscheinlichkeit in der Lage, einen möglichen Effekt zu finden, da deine Power geringer wird. Als Folge könntest du über viele Experimente zu dem Entschluss kommen, dass es keine Veränderung in der intrinsischen Motivation kommt, obwohl dieser Effekt existiert. Du solltest daher von vorneherein überlegen, ob dein Design abhängig oder unabhängig ist. Erst dann kannst du die korrekte Verfahren zum Testen deiner Hypothese auswählen.