R hat den nächsten Meilenstein erreicht: 10.000 Pakete auf CRAN. Von A3 bis zyp, von der ABC-Analyse bis zu Zero-Inflated Models – 10.000 R-Pakete bedeuten Vielfalt und Methoden für nahezu jeden Anwendungsfall. Anlässlich des Jubiläums haben wir die Top 10 der R-Pakete zusammengestellt und die gefragt, die es wissen müssen: unsere Data Scientists.

Übersicht über die eoda Top 10 der R-Pakete
Übersicht über die eoda Top 10 der R-Pakete

Unsere Top 10 der R-Pakete

  • Hmisc: Hmisc war eines der ersten regelmäßig verwendeten R-Pakete bei eoda. Heute nutzen wir Hmisc kaum noch, aber aus nostalgischen Gründen ein klarer Fall für unsere Top 10.
  • data.table: R als In-Memory-Datenbank mit data.table. Wer hat gesagt R wäre langsam?
  • TraceR: Herausragendes Profiling-Paket. Findet jeden Flaschenhals.
  • dplyR: Nicht nur schnell in der Auswertung, sondern auch leicht zu erlernen. Intuitives Datenmanagement mit R trägt einen Namen – dplyR.
  • ggplot2: Der Garant für die einfache Erstellung anschaulicher Grafiken.
  • magrittr: %>%. Der Pipe Operator macht aus komplizierten Verschachtelungen lesbare Verkettungen.
  • shiny: Interaktive Webapplikationen mit geringem Programmieraufwand in HTML und JavaScript.
  • tidyr: Sehr gute Funktionalitäten um Daten umzustrukturieren. Besonders hervorzuheben: Die Funktionen gather und spread, um Daten von long to wide-Format oder wide to long-Format zu konvertieren.
  • caret: caret vereinheitlicht die Data Mining Algorithmen in einem Interface.
  • rcpp: Ein Paket, das wir selber nicht explizit verwenden, aber trotzdem unverzichtbarer Bestandteil unserer Top 10 ist, da es wichtiger Bestandteil so vieler anderer guter R-Pakete ist.

Wir dürfen gespannt sein, welche R-Pakete in Zukunft zu unverzichtbaren Wegbegleitern werden und es in die Hitliste anlässlich des 20.000. R-Pakets schaffen.

Jetzt heißt es aber erstmal: Herzlichen Glückwunsch an die weltweite R-Community und das R Core-Team.