3.4 Dateien importieren

In diesem Kurs arbeiten wir mit Daten, die in Tabellen angeordnet sind. Häufig liegen Daten als Excel-Dateien vor. Ein gängiges Format, um Daten zu speichern sind CSV Dateien. CSV steht für Comma Seperated Values. Dies bedeutet, dass Werte in CSV Dateien entweder durch ein Komma oder ein Semikolon getrennt sind:

id,variable1,variable2
ku22su99,2,3
nn08se21,5,6

Da CSV-Dateien ein sehr bekanntes Dateiformat für Daten sind, lassen sich CSV-Dateien sowohl in Excel, Jamovi, SPSS, als auch R importieren (Excel, SPSS, Jamovi).

Eine CSV-Datei können wir in R importieren, indem wir die Datei in dem Panel Files suchen und auf die Datei klicken. Klicke anschließend auf Import Dataset:

Anschließend siehst du ein Fenster, in welchem der Code angezeigt wird, mit dem wir die Daten importieren können (achte darauf, dass du bereits das Paket tidyverse zu diesem Zeitpunkt installiert haben solltest):

Wir benötigen nur die zweite Zeile des Codes (im Foto oben gelb markiert). Diesen fügst du in dein R-Skript ein. Achte darauf, dass du vorher das Paket tidyverse geladen hast:

Im nächsten Schritt liest du den Datensatz ein, indem du den Befehl ausführst:

Die rote Schrift hat keine Bedeutung. Sie zeigt an, welche Variablen der Datensatz umfasst. Um zu prüfen, ob der Datensatz in der Variable gespeichert wurde, gebe Dir die Variable in der Konsole aus:

Gleichzeitig kannst du im Panel Environment sehen, ob dein Datensatz geladen wurde:

Der Output zeigt uns an, dass der Datensatz 1470 Reihen und 17 Variablen hat.

Der Name des Datensatzes ist im Übrigen willkürlich. Wir haben in diesem Fall den Datensatz hr_cleaned genannt. Er hätte genausogut human_resources oder hr heißen können.