7.7 Miniprojekt

Den Datensatz für dieses Miniprojekt findest du hier.

In diesem Miniprojekt untersuchen wir, ob es einen Zusammenhang zwischen der Freiheit in Ländern und dem Glück der Bevölkerung gibt. Laden wir zunächst den Datensatz in R:

## Observations: 155
## Variables: 12
## $ Country                       <chr> "Norway",…
## $ Happiness.Rank                <dbl> 1, 2, 3, …
## $ Happiness.Score               <dbl> 7.537, 7.…
## $ Whisker.high                  <dbl> 7.594445,…
## $ Whisker.low                   <dbl> 7.479556,…
## $ Economy..GDP.per.Capita.      <dbl> 1.616463,…
## $ Family                        <dbl> 1.533524,…
## $ Health..Life.Expectancy.      <dbl> 0.7966665…
## $ Freedom                       <dbl> 0.6354226…
## $ Generosity                    <dbl> 0.3620122…
## $ Trust..Government.Corruption. <dbl> 0.3159638…
## $ Dystopia.Residual             <dbl> 2.277027,…

Die Variablennamen sind nicht ganz sauber. Reinigen wir die Variablen daher zunächst mit der Funktion clean_names des Pakets janitor:

## Observations: 155
## Variables: 12
## $ country                     <chr> "Norway", "…
## $ happiness_rank              <dbl> 1, 2, 3, 4,…
## $ happiness_score             <dbl> 7.537, 7.52…
## $ whisker_high                <dbl> 7.594445, 7…
## $ whisker_low                 <dbl> 7.479556, 7…
## $ economy_gdp_per_capita      <dbl> 1.616463, 1…
## $ family                      <dbl> 1.533524, 1…
## $ health_life_expectancy      <dbl> 0.7966665, …
## $ freedom                     <dbl> 0.6354226, …
## $ generosity                  <dbl> 0.3620122, …
## $ trust_government_corruption <dbl> 0.3159638, …
## $ dystopia_residual           <dbl> 2.277027, 2…

Uns interessieren nun die Variablen happiness_score und freedom. Unsere Hypothese lautet, dass Menschen die mehr Freiheit haben, glücklicher sind. Zunächst ist es hilfreich, eine Visualisierung dieses Zusammenhangs durch ein Streudiagram anzuzeigen:

Du siehst bereits, dass mit ansteigender Freiheit das Glück der Bevölkerung steigt. Je mehr Freiheit ein Land hat, desto glücklicher ist das Land. Wir können diesen Zusammenhang durch eine Korrelation berechnen:

## [1] 0.5701372

Es handelt sich um eine moderate Korrelation von \(.57\). Die Augenscheinvalidität reicht allerdings nicht aus, um unsere Hypothese zu testen. Hierfür müssen wir den Regressionskoeffizienten auf Signifikanz prüfen. Bevor wir allerdings die Hypothese auf Signifikanz prüfen, überlegen wir erneut, wie hoch eigentlich unser Power ist, bzw. wie wahrscheinlich werden wir anhand dieser Studie ein signifikantes Ergebnis erhalten? Um die Power zu berechnen, können wir das Paket pwr verwenden.

Sagen wir, wir erwarten hypothetisch eine Korrelation von \(r = .80\). Zudem möchten wir eine Power von .80 erhalten. Wie viele Datenpunkte bräuchten wir, um diese Hypothese zu testen?

## 
##      approximate correlation power calculation (arctangh transformation) 
## 
##               n = 8.990898
##               r = 0.8
##       sig.level = 0.05
##           power = 0.8
##     alternative = two.sided

9 Länder. Unsere Studie mit 155 Ländern ist demnach massiv überpowered. Wir haben 146 Länder mehr als wir für eine Power von 0.80 bräuchten. Hättest du daher eine Studie gemacht, hättest du dir ersparen können weitere 146 Länder zu befragen. Die Power zur Testung deiner Hypothese hätte bereits bei 9 Ländern genügt. Es ist demnach immer sehr hilfreich, die Power einer Studie zu berechnen, bevor man eine Studie durchführt. Ansonsten läuft man Gefahr (1) keine Ergebnisse zu erhalten, und (2) zu viele Daten zu erheben. Normalerweise ist das größte Problem, dass die Stichprobengröße zu gering ist.

Jetzt, nachdem wir die Power der Studie kennen, können wir unsere Hypothese testen. Wir wissen bereits jetzt, dass wir mit fast 100%iger Wahrscheinlichkeit ein signifikantes Ergebnis erhalten. Zunächst müssen wir den gereinigten Datensatz exportieren:

Anschließend wählen wir in Jamovi den Datensatz ein und wählen Regression -> Linear Regression. Folge abhängige und unabhängigen Variablen fügen wir ein. Achte darauf, auch das Konfidenzintervall anzugeben:

Im Anschluss kopieren wir den Output von Jamovi in R:

## 
##  LINEAR REGRESSION
## 
##  Model Fit Measures                                          
##  ----------------------------------------------------------- 
##    Model    R        R²       F       df1    df2    p        
##  ----------------------------------------------------------- 
##        1    0.570    0.325    73.7      1    153    < .001   
##  ----------------------------------------------------------- 
## 
## 
##  MODEL SPECIFIC RESULTS
## 
##  MODEL 1
## 
##  Model Coefficients - happiness_score                                    
##  ----------------------------------------------------------------------- 
##    Predictor    Estimate    SE       Lower    Upper    t        p        
##  ----------------------------------------------------------------------- 
##    Intercept        3.60    0.218     3.17     4.03    16.49    < .001   
##    freedom          4.30    0.501     3.31     5.29     8.58    < .001   
##  -----------------------------------------------------------------------

Tatsächlich, die Korrelation ist signifikant, das heißt, wir verwerfen die Nullhypothese, dass es keine Korrelation der beiden Variablen gibt und gehen vorläufig davon aus, dass Menschen glücklicher sind, je mehr Freiheit sie haben. Zudem erkennen wir, dass das Modell 32,5% den Fehler im kompakten Modell erklärt. Diese Effektstärke ist ein beträchtlicher Anteil, welcher uns in der Annahme bestärkt, dass mehr Freiheit mit einer größeren Zufriedenheit in Zusammenhang steht. Das Ergebnis berichten wir anschließend:

Eine einfache lineare Regression ergab einen signifikanten Zusammenhang zwischen der erfahrenden Freiheit der Bürger und ihrem empfundenen Glück, F(1, 153) = 73.7, p < .001, 95%s CI [3.31, 5.39] \(R^2\) = .33. Je mehr Freiheit Menschen erfahren, desto glücklicher sind sie.

Oder als t-Test:

Eine einfache lineare Regression ergab einen signifikanten Zusammenhang zwischen der erfahrenden Freiheit der Bürger und ihrem empfundenen Glück, t(153) = 16.49, p < .001, 95% CIs [3.31, 5.39], \(R^2\) = .33. Je mehr Freiheit Menschen erfahren, desto glücklicher sind sie.

Die Daten zeigen im Übrigen auch, dass die Freiheit allein nur 33% der Varianz im Glück der Menschen aufklärt. Es gibt demnach noch andere Variablen, welche uns helfen, theoretisch zu erklären, weshalb Menschen glücklich sind.