Yet another R blog

Packages • Praxis • Plots

Seite 2 von 3

So funktioniert dplyr

dplyr vereinfacht den Umgang mit Data Frames

Die Arbeit mit Data Frames in R kann ganz schon mühsam sein, es sei denn, man benutzt dplyr. Dieser Artikel führt durch die nützlichsten Funktionen dieses praktischen R-Packages. Weiterlesen

Interaktive Charts mit googleVis

Mit googleVis auf die Google Chart API zugreifen

Das Package googleVis versorgt R mit einer Schnittstelle zur Google Chart API. Damit lassen sich interaktive Plots erstellen und in Webseiten einbetten. Die Daten bleiben dabei lokal und werden nicht zu Google hochgeladen. Als Beispiel dient eine interaktive Weltkarte, die die Bevölkerung des Landes anzeigt, das sich gerade unter dem Mauszeiger befindet. Weiterlesen

Linienglättung mit ggplot2

Linienglättung hebt die wesentlichen Aussagen eines Plots hervor

Wenn Daten oder Messwerte in einem Plot dargestellt werden, gibt es oft Schwankungen und Ausreißer. Die Linienglättung zeigt eine Art gleitenden Mittelwert und macht die Kernaussage eines Plots verständlicher. ggplot2 stellt alle nötigen Werkzeuge dafür bereit. Weiterlesen

Datum und Zeit mit lubridate

Mit lubridate macht die Arbeit mit Datum und Zeit viel Spaß

Wer schon mal in R mit Datums- und Zeitangeben gearbeitet hat, der weiß, dass es wie es im Englischen so schön heißt „a pain in the ass“ ist. Datumsangeben kommen in unterschiedlichen Formaten daher, aus denen sich nur schwer einzelne Komponenten wie Tag, Monat oder Jahr exrahieren lassen. Dazu kommt der umständliche Umgang mit Zeitzonen, Sommerzeit und Schaltjahren. Mit dem Package lubridate (Link) ist das alles kein Problem. Weiterlesen

Lorenzkurven

Lorenzkurven visualisieren Ungleichheiten etwa bei der Einkommensverteilung

Lorenzkurven sind eine grafische Darstellungsform für die Abbildung von Ungleichheit und werden typischerweise für Einkommensverteilungen verwendet. Eingeführt hat sie Max Otto Lorenz im Jahr 1905. Das Beispiel zeigt die Lorenzkurve der Einkommensverteilung in Deutschland im Jahr 2011. Weiterlesen

Bundeshaushalt als Treemap

Treemap: Je größer die Zahl, desto größer die Fläche

Eine Treemap stellt Zahlenwerte als verschachtelte Rechtecke dar, wobei die Fläche der Rechtecke die Größenverhältnisse der Zahlen abbildet. R verwendet dafür das Package treemap. Als Beispiel wird hier der Bundeshaushalt des Jahres 2015 visualisiert. Weiterlesen

Zufallszahlen erzeugen

R bringt mehrere Generatoren für Zufallszahlen mit

Zufallszahlen spielen oft eine wichtige Rolle bei der Analyse von Daten. R bringt eine Reihe von Funktionen mit, die solche Zahlen aus verschiedenen Verteilungen generieren. Weiterlesen

Der Niedergang der SPD

Plots der Sitzverteilung im Deutschen Bundestag

Die Sitzverteilung in einem Parlament wird häufig mit einer Grafik dargestellt, für die es keinen richtigen Namen gibt. Am treffendsden sind noch die Bezeichnungen Halbkreisdiagramm oder besser noch Halbringdiagramm. Ein solches Diagramm mit ggplot2 zu erstellen, erfordert einige Umwege. Weiterlesen

Bevölkerungspyramiden plotten

Nur wenige Länder haben eine Altersverteilung in Pyramidenform

Bevölkerungspyramiden zeigen die Altersverteilung einer Population. Grafisch betrachtet handelt es sich dabei um zwei vertikale Barplots. Die entsprechenden Daten für sämtliche Länder der Erde lassen sich online von der Seite www.census.gov abrufen und direkt im Skript verwerten. Weiterlesen

Zeitreihen mit ggfortify

Mit ggfortify lassen sich viele R-Datentypen plotten

Eine Art Quasi-Standard für das Plotten mit R ist ggplot2. Es benötigt aber als Datenquelle einen Data Frame. Manchmal liegen die Daten aber in einem anderen Format vor, etwa Time Series oder xts. Hier hilft ggfortify, das eine ganze Latte Formate plotten kann. Es basiert auf ggplot2, so dass sich der Plot mit ggplot2-Syntax modifizieren lässt. Weiterlesen

« Ältere Beiträge Neuere Beiträge »