Daten im Überfluss sind gleichzeitig Fluch und Segen unserer Zeit. Mit dem Zugmonitor hat die Süddeutsche Zeitung ein besonders anschauliches Projekt initiiert, das die Möglichkeiten und den Nutzen von „Big Data“ aufzeigt. eoda erklärt in einem Screecast, wie man die Daten mit Hilfe R in Echtzeit für Excel-Nutzer aufbereiten kann.
Beim Zugmonitor wird aus den offiziellen Angaben der Bahn eine Live-Karte zu Verspätungen im Fernverkehr dargestellt. Zusätzlich werden die Rohdaten per API von OpenDataCity zur Verfügung gestellt. Dabei können beträchtliche Datenmengen zusammen kommen, denn pro Tag kann man hier die Daten für ca. 1000 Zugeinfahrten abfragen. Die Analyse dieser Rohdaten ist ein schönes Beispiel für „Business Analytics“. Man kann auf Basis dieser Daten verschiedenen Fragestellungen nachgehen:
eoda setzt bei Datenanalyse auf R, die zur Zeit vermutlich mächtigste Sprache zur umfassenden Datenanalyse, die gerade rapide an Verbreitung zunimmt. Dieser Trend wird aktuell dadurch untermauert, dass SAP scheinbar plant, seine „Predicitive Analytic Lösungen“ für R zu öffnen.
Heiko Miertzsch - Beitrag vom 13.04.2012
Heiko Miertzsch ist einer der beiden Gründer der eoda GmbH.