4.8 Vertiefung Datenvisualisierung

ggplot arbeitet sehr gut zusammen mit dem Pipe-Operator. Der herkömmliche Weg ist es, den Datensatz direkt in die Funktion ggplot einzutragen:

Genausogut können wir allerdings einen Datensatz durch den Pipe-Operator in ggplot übergeben. Durch den Pipe-Operator müssen wir nicht eine neue Variable erstellen, die wir später ohnehin nicht mehr benötigen:

4.8.1 facets

Manchmal möchten wir mehrere Visualisieren auf einmal abhängig einer nominalskalierten Variable erstellen. Dies können wir in ggplot durch die Funktion facet_wrap erreichen:

Zu Beginn von facet_wrap tragen wir eine Tilde ~ ein. Anschließend kennzeichen wir die nominalskalierte Variable (Achtung wichtig. Bei einer intervallskallierten Variable würden wir zu viele Visualisieren erhalten): facet_wrap(~ NOMINALSKALIERTE_VARIABLE).

Durch facets können wir Unterschiede zwischen Gruppen deutlicher machen. Beispielsweise könnten wir untersuchen, ob sich die Gehaltsverteilung zwischen Männern und Frauen unterscheidet?

4.8.2 labs

Visualisieren brauchen einen Titel und eine vernünftige Achsenbeschriftung. Dies können wir durch labs umsetzen:

Verschiedene Labels (labs) sind in der Regel wichtig:

  • title: Damit geben wir die Überschrift der Visualisierung an
  • subtitle: Der Untertitel der Visualisierung
  • x: Damit geben wir die Beschriftung der x-Achse an
  • y: Damit geben wir die Beschriftung der y-Achse an
  • caption: Damit geben wir zusätzliche Informationen an, die wichtig für das Verständnis der Visualisierung sind.

Nicht immer haben die Legenden in Variablen den richtigen Namen. Diese können wir genausogut mit labs ändern:

4.8.3 guides

Manchmal benötigen wir nicht einmal Legenden, beispielsweise, wenn wir Balkendiagrammen Farben zuweisen. Mit guides können wir Legenden entfernen:

Verglichen mit:

4.8.4 coord_flip

Mit coord_flip können wir die Achsen in einer Visualisierung tauschen. Das ist immer hilfreich, wenn sich die Werte auf der x-Achse überschneiden:

Mit coord_flip wird die Lesbarkeit einfacher:

4.8.5 themes

Visualisierungen, die mit ggplot erstellt werden, haben einen typischen Stil. Genausogut sind Visualisierungen, die mit Excel erstellt werden, sehr schnell zu erkennen. Mit Hilfe von themes können wir allerdings das Aussehen von Visualisierungen einfach ändern:

4.8.9 ggthemes

Wer noch ausgefallener werden möchte, kann sich auch das Paket ggthemes herunterladen:

Diese Pakete sind nicht Teil des Kurses und sollen dir die Möglichkeiten aufzeigen.

4.8.10 Visualisierungen speichern

Um Visualisierungen speichern zu können wir entweder über die Buttons in R-Studio verwenden oder einen Befehl ausführen. Über das Panel Plots kannst du die Visualisierungen direkt speichern:

Anschließend gibst du den Ordner an, in den du die Visualisierung speichern möchtest. Zudem musst du den Namen der Datei unter File name: angeben:

Drucke auf Save und die Grafik wird gespeichert.

Visualisierungen können auch durch den Befehl ggsave gespeichert werden. Achte bitte darauf, dass du vorab weiß, wo dein aktuelles Arbeitsverzeichnis liegt. Dieses kannst du in R-Studio mit der Tastenkürzel STRG + UMSCHALT + H ändern. In R kannst du dir das Arbeitsverzeichnis durch den Befehl getwd() ausgeben lassen.

Führe einfach direkt nachdem du eine Visualisierung erstellt hast, den Befehl aus: