9.10 Miniprojekt

Die Daten für das Miniprojekt findest du hier.

Stell dir vor du möchtest die Wirksamkeit verschiedener Diäten prüfen. Insgesamt sollen bei deinem Experiment 78 Probanden unterschiedliche Diäten über mehrere Wochen durchführen. Du wiegst die Probanden am Anfang des Experiments und am Ende des Experiments. Folgende Hypothesen hast du vor dem Experiment.

  • Die Gewichtsreduzierung der Gruppen unterschiedet sich nach den zehn Wochen.
  • Die dritte Diät ist im Vergleich zu den anderen Diäten am effektivsten.

Versuchen wir im Folgenden diese Hypothesen zu prüfen. Laden wir zunächst den Datensatz und die Pakete, die wir benötigen:

## Parsed with column specification:
## cols(
##   Person = col_double(),
##   gender = col_double(),
##   Age = col_double(),
##   Height = col_double(),
##   pre.weight = col_double(),
##   Diet = col_double(),
##   weight6weeks = col_double()
## )
## Observations: 78
## Variables: 7
## $ Person       <dbl> 25, 26, 1, 2, 3, 4, 5, 6, …
## $ gender       <dbl> NA, NA, 0, 0, 0, 0, 0, 0, …
## $ Age          <dbl> 41, 32, 22, 46, 55, 33, 50…
## $ Height       <dbl> 171, 174, 159, 192, 170, 1…
## $ pre.weight   <dbl> 60, 103, 58, 60, 64, 64, 6…
## $ Diet         <dbl> 2, 2, 1, 1, 1, 1, 1, 1, 1,…
## $ weight6weeks <dbl> 60.0, 103.0, 54.2, 54.0, 6…

Die Variablen des Datensatzes sind noch nicht ganz sauber. Versuchen wir diese zunächst durch die Funktion clean_names aus dem Paket janitor zu reinigen:

## Observations: 78
## Variables: 7
## $ person       <dbl> 25, 26, 1, 2, 3, 4, 5, 6, …
## $ gender       <dbl> NA, NA, 0, 0, 0, 0, 0, 0, …
## $ age          <dbl> 41, 32, 22, 46, 55, 33, 50…
## $ height       <dbl> 171, 174, 159, 192, 170, 1…
## $ pre_weight   <dbl> 60, 103, 58, 60, 64, 64, 6…
## $ diet         <dbl> 2, 2, 1, 1, 1, 1, 1, 1, 1,…
## $ weight6weeks <dbl> 60.0, 103.0, 54.2, 54.0, 6…

Die Variable diet ist als dbl gespeichert. Wir sollten darauf achten, dass es sich um einen Faktor handelt. Gleichzeitig sollten wir wissen, welche Reihenfolge die Levels des Faktors haben. Hierzu können wir uns zunächst die Ausprägungen der Variable anschauen und anschließend die Reihenfolge der Levels definieren:

## # A tibble: 3 x 2
##    diet     n
##   <dbl> <int>
## 1     1    24
## 2     2    27
## 3     3    27
## [1] "3" "1" "2"

Wir möchten zudem als abhängige Variable die Gewichtsreduzierung der Probanden prüfen. Momentan liegen die Variablen pre_weight und weight6weeks vor. Definieren wir daher die Differenz dieser Werte:

## Observations: 78
## Variables: 8
## $ person       <dbl> 25, 26, 1, 2, 3, 4, 5, 6, …
## $ gender       <dbl> NA, NA, 0, 0, 0, 0, 0, 0, …
## $ age          <dbl> 41, 32, 22, 46, 55, 33, 50…
## $ height       <dbl> 171, 174, 159, 192, 170, 1…
## $ pre_weight   <dbl> 60, 103, 58, 60, 64, 64, 6…
## $ diet         <fct> 2, 2, 1, 1, 1, 1, 1, 1, 1,…
## $ weight6weeks <dbl> 60.0, 103.0, 54.2, 54.0, 6…
## $ diff         <dbl> 0.0, 0.0, -3.8, -6.0, -0.7…

Schauen wir uns im nächsten Schritt einen Boxplot der drei Gruppen an:

Tatsächlich scheinen die Probanden bei Gruppe 3 am stärksten ihr Gewicht reduziert zu haben.

9.10.1 Prüfung der ersten Hypothese

Prüfen wir als Nächstes unsere erste Hypothese:

Die Gewichtsreduzierung der Gruppen unterschiedet sich nach den zehn Wochen

Um diese Hypothese in Jamovi zu überprüfen, müssen wir den gereinigten Datensatz zunächst exportieren. Hierfür solltest du zunächst das Arbeitsverzeichnis definieren (Strg + Umschalt + H in R-Studio):

Anschließend importieren wir den Datensatz in Jamovi und berechnen die einfaktorielle Varianzanalyse:

In der Tat gibt es signifikante Unterschiede zwischen den Gruppen. Die Mittelwerte scheinen sich voneinander zu unterschieden, da wir ein signifkantes Ergebnis erzielen. Fügen wir unser Ergebnis anschließend in unser R-Skript ein:

## 
##  ANOVA
## 
##  ANOVA                                                                          
##  ------------------------------------------------------------------------------ 
##                 Sum of Squares    df    Mean Square    F       p        <U+03B7>²p     
##  ------------------------------------------------------------------------------ 
##    diet                   71.1     2          35.55    6.20    0.003    0.142   
##    Residuals             430.2    75           5.74                             
##  ------------------------------------------------------------------------------

9.10.2 Prüfung des spezifischen Kontrasts

Prüfen wir nun unseren Kontrast:

Die dritte Diät ist im Vergleich zu den anderen Diäten am effektivsten

Hierzu können wir direkt den Output von Jamovi verwenden und uns die Konfidenzintervalle mit emmeans berechnen lassen:

##  diet emmean    SE df lower.CL upper.CL
##  XMw   -5.15 0.461 75    -6.07    -4.23
##  XMQ   -3.30 0.489 75    -4.27    -2.33
##  XMg   -3.03 0.461 75    -3.94    -2.11
## 
## Confidence level used: 0.95

Die Faktorennamen sind etwas kryptisch, das macht aber nichts, da wir die Reihenfolge der Levels bereits kennen:

## [1] "3" "1" "2"

Unseren Kontrast können wir daher folgendermaßen berechnen:

##  contrast         estimate   SE df t.ratio p.value
##  three_vs_one_two    -3.97 1.14 75 -3.481  0.0008

In der Tat, der Kontrast ist signifikant. Personen, die die dritte Diät erhalten, reduzieren ihr Gewicht signifikant stärker als die anderen Gruppen.

Alternativ könnten wir den Kontrast direkt in Jamovi berechnen und in R übertragen:

## 
##  ANOVA
## 
##  ANOVA                                                                          
##  ------------------------------------------------------------------------------ 
##                 Sum of Squares    df    Mean Square    F       p        <U+03B7>²p     
##  ------------------------------------------------------------------------------ 
##    diet                   71.1     2          35.55    6.20    0.003    0.142   
##    Residuals             430.2    75           5.74                             
##  ------------------------------------------------------------------------------ 
## 
## 
##  CONTRASTS
## 
##  Contrasts - diet                                   
##  -------------------------------------------------- 
##                Estimate    SE       t       p       
##  -------------------------------------------------- 
##    1 - 3           1.85    0.672    2.75    0.007   
##    2 - 3, 1        1.20    0.570    2.10    0.039   
##  --------------------------------------------------

Allerdings sind die Kontraste plötzlich in R anders. Dies liegt daran, dass wir die Levels des Faktors diet geändert hatten. Diese werden nicht durch den Export übertragen. Wenn wir diese anpassen, sollte das gleiche Ergebnis wie in Jamovi erscheinen:

## 
##  ANOVA
## 
##  ANOVA                                                                          
##  ------------------------------------------------------------------------------ 
##                 Sum of Squares    df    Mean Square    F       p        <U+03B7>²p     
##  ------------------------------------------------------------------------------ 
##    diet                   71.1     2          35.55    6.20    0.003    0.142   
##    Residuals             430.2    75           5.74                             
##  ------------------------------------------------------------------------------ 
## 
## 
##  CONTRASTS
## 
##  Contrasts - diet                                      
##  ----------------------------------------------------- 
##                Estimate    SE       t         p        
##  ----------------------------------------------------- 
##    2 - 1          0.274    0.672     0.408     0.684   
##    3 - 1, 2      -1.985    0.570    -3.481    < .001   
##  -----------------------------------------------------

Tatsächlich, nun erhalten wir die gleichen Kontraste.

Wir möchten für jeden Test in der Regel die Effektstärke mit angeben. Jamovi und emmeans geben diese leider nicht aus. Wir können die Effektstärke Cohen’s d allerdings händisch berechnen. Die Formel hierzu lautet:

\[ \begin{aligned} d &= \frac{M_1 - M_2}{SD_{pooled}} \\ &= \frac{M_1 - M_2}{\sqrt{\frac{sd_1^2 + sd_2^2}{2}}} \end{aligned} \]

Wir brauchen daher die Mittelwerte der beiden Gruppen. Diese haben wir bereits berechnet:

## # A tibble: 2 x 3
##   contrast_groups  mean    sd
##   <chr>           <dbl> <dbl>
## 1 3               -5.15  2.40
## 2 rest            -3.15  2.37

Nun können wir das Cohen’s d berechnen:

## [1] 0.8385578

Es handelt sich daher um einen großen Effekt.

9.10.3 Ergebnisse berichten

Wir können unser Ergebnis daher folgendermaßen berichten:

Um zu prüfen, ob die verschiedenen Diäten zur Gewichtsreduzierung der Probanden beigetragen haben, wurde eine einfaktorielle Varianzanalyse berechnet. Die abhängige Variable war die Gewichtsreduzierung in Kilogramm im Abstand der zehn Wochen während der Diät, die unabhängige Variable war die jeweilige Diät. Wir fanden einen signifikanten Effekt der Gruppe, F(2, 75) = 6.20, p < .01, \(\eta^2_p\) = 0.14 (großer Effekt). Spezifische Kontraste ergaben, dass die dritte Diät zu einer stärkeren Gewichtsreduzierung als die anderen beiden Gruppen beigetragen hat, t(74), p < .001, d = 0.84 (großer Effekt).