4 Grundlagen der Datenanalyse II

In diesem Modul lernst du, Daten zu verarbeiten und zu visualisieren. Die Verarbeitung der Daten ist zu Beginn der Datenanalyse ein wichtiger Schritt, da Daten häufig gereinigt und verändert werden müssen, bevor wir mit ihnen statistische Verfahren rechnen können. Im letzten Modul hast du bereits die Funktionen mutate, filter und select Funktion kennengelernt. Diese Funktionen ermöglichen uns erste Verarbeitung der Daten, sie sind allerdings nicht ausreichend, um Daten für die statistische Analyse aufzubereiten. Wir werden daher in diesem Modul folgende Funktionen kennenlernen:

Zudem werden wir uns in diesem Modul mit der Visualisierung der Daten beschäftigen. Die Visualisierung dient häufig der Exploration von Daten, beispielsweise um Ausreißer in einem Datensatz zu finden oder Verteilungen zu betrachten. Wir werden in diesem Kurs das Paket ggplot2 verwenden, mithilfe dessen alle erdenklichen Visualisierungen erstellt werden können.