3.7 Grundlegende Funktionen in R

Es gibt ein paar wenige Befehle, die du immer wieder in R benötigst. Wir werden die Befehle anhand des Datensatzes hr_cleaned kennenlernen, den du hier herunterladen kannst. Zunächst müssen wir tidyverse laden und den Datensatz importieren:

Mit View kannst du Dir den Datensatz in einem Excel-ähnlichen Format betrachten:

Du kannst dir die Variablennamen mit der Funktion colnames ausgeben lassen:

##  [1] "id"                         "age"                       
##  [3] "department"                 "distance_from_home"        
##  [5] "education"                  "employee_count"            
##  [7] "gender"                     "job_role"                  
##  [9] "job_satisfaction"           "marital_status"            
## [11] "monthly_income"             "num_companies_worked"      
## [13] "performance_rating"         "total_working_years"       
## [15] "work_life_balance"          "years_at_company"          
## [17] "years_since_last_promotion"

Manchmal möchte man wissen, wie viele Reihen in einem Datensatz stecken. Hierfür kannst du die Funktion nrow verwenden:

## [1] 1470

Genausogut lassen sich die Anzahl der Variablen (bzw. Spalten) in einem Datensatz mit der Funktion ncol ausgeben lassen:

## [1] 17

Zuletzt benötigen wir noch die Funktion head. Mithilfe von head können wir uns die ersten Reihen eines Datensatzes ansehen:

## # A tibble: 6 x 17
##      id   age department distance_from_h… education employee_count gender
##   <dbl> <dbl> <chr>                 <dbl> <chr>              <dbl> <chr> 
## 1     1    41 Sales                     1 College                1 Female
## 2     2    49 Research …                8 Below Co…              1 Male  
## 3     3    37 Research …                2 College                1 Male  
## 4     4    33 Research …                3 Master                 1 Female
## 5     5    27 Research …                2 Below Co…              1 Male  
## 6     6    32 Research …                2 College                1 Male  
## # … with 10 more variables: job_role <chr>, job_satisfaction <chr>,
## #   marital_status <chr>, monthly_income <dbl>,
## #   num_companies_worked <dbl>, performance_rating <chr>,
## #   total_working_years <dbl>, work_life_balance <chr>,
## #   years_at_company <dbl>, years_since_last_promotion <dbl>