Entwicklungsumgebungen: Welche ist die richtige für R und Python?

Wer im Data-Science-Kontext programmiert, braucht dafür eine geeignete integrierte Entwicklungsumgebung. Eine Entwicklungsumgebung, auch IDE (Integrated Development Environment) genannt, muss dabei je nach Data-Science-Sprache und Anwendungsfall unterschiedliche Anforderungen erfüllen. Dabei hat jede Entwicklungsumgebung ihre ganz eigenen Vor- und Nachteile. Wir stellen vier Entwicklungsumgebungen für R und Python vor, die auch Sie überzeugen werden.

Warum eine IDE?

Auch beim Coden gilt: Werkzeuge machen das Leben leichter. Aus diesem Grund sind integrierte Entwicklungsmethoden für viele Programmierer und Analysten treuer Begleiter. Die Entscheidung, welche IDE der User nutzt, ist zum größten Teil eine Frage des Geschmacks. Jede IDE hat dabei den Anspruch, möglichst viele für den User nützliche Werkzeuge unter einem Dach zu vereinen. Denn der Code steht immer im Fokus und lässt sich durch die vielen nützlichen Hilfsmittel leichter verarbeiten, optimieren und testen. Gängige integrierte Features sind beispielsweise die Hervorhebung der Syntax, Debugging-Möglichkeiten, Versionsverwaltungen und viele mehr.

Klassische Entwicklungsumgebungen im Wandel

Viele Programmierer und Data Scientists wollen nicht mehr auf den Komfort verzichten, den eine gute IDE mit sich bringt, weshalb ein einfacher Text Editor oft nicht ausreicht. Das Konzept hat sich also längst durchgesetzt. Auch Anbieter von ähnlichen Formaten wie Text Editoren ziehen inzwischen nach und setzen auf einen erweiterten Funktionsumfang durch Plug-Ins. Der User hat so den Vorteil, nur gezielt die Funktionen zu intergieren, die er benötigt. Dabei entstehen auch ganz eigene Formate wie beispielsweise Notebooks.

R mit RStudio

Alles auf einen Blick: Durch die visuelle Aufteilung der verschiedenen Panel in nur einer View ist das Programmieren von R mit der Open-Source-IDE RStudio ein Kinderspiel. Statt von Fenster zu Fenster wechseln zu müssen, bekommt der User einen guten Überblick über sein Analyse-Projekt. RStudio bietet dabei die wichtigsten Funktionen wie Syntax-Highlighting, Versionierung, grafische Ausgaben via Plot-Funktion und viele weitere Tools, die ein komfortables Programmieren ermöglichen. „Mich reizt bei RStudio die Kombination vieler Funktionen: Die Git-Integration, eine hilfreiche Autovervollständigung von Code und die leichte Integration mit Shiny machen RStudio zu einer Entwicklungsumgebung, die meinen Arbeitsalltag enorm bereichert“, weiß auch Martin Schneider, Data Scientist bei eoda.

Übrigens: Die vielen R-Pakete innerhalb der Bibliotheken fungieren auch als mögliche Game-Changer. So kann mithilfe des Pakets „reticualte“ bereits jetzt mit RStudio Python-Code verarbeitet werden.


Die Programmiersprache R ist eine der besten Lösungen zur Analyse und Visualisierung von Daten, für Data Mining und Predictive Analytics.

R ist besonders leistungsfähig und im Vergleich zu den großen kommerziellen Softwarepaketen zur Datenanalyse sehr flexibel. R ist Open Source und wird vor allem von einer weltweiten Entwicklergemeinde im wissenschaftlichen Umfeld weiterentwickelt. Allein dadurch setzt R einen nie erreichten Maßstab an Funktionalität, Qualität und Aktualität.


Mit der Multipurpose-Sprache Python können die Daten in sekundenschnelle analysiert und die Ergebnisse verwertet werden. Wenn es um das Einlesen großer Daten geht und keine Datenbank zur Verfügung steht, dann ist Python flexibler in der Nutzung.

Entwicklungsumgebungen für Python

Python entwickelt sich immer mehr zu einer beliebten Programmiersprache im Data-Science-Kontext. Da Python eine Multipurpose-Sprache ist und sich beispielsweise auch zur Software-Entwicklung gut eignet, gibt es auch hier Entwicklungsumgebungen mit unterschiedlichem Funktions-Fokus. Durch verschiedene Plugins kann jede Entwicklungsumgebung für die individuellen Bedürfnisse der User weiter optimiert werden.

Data Science mit Spyder

Um die ersten Gehversuche mit Python in Richtung Data Science erfolgreich zu stemmen, eignet sich die integrierte Entwicklungsumgebung Spyder. Die Open-Source-IDE hat die ersten Data-Science-Bibliotheken bereits integriert – somit kann jeder Data Scientist sofort loslegen. Jeder, der mit der Data-Science-Sprache R bereits via RStudio gearbeitet hat, wird sich mit Spyder wohl fühlen, denn rein optisch ähneln sich beide Entwicklungsumgebungen sehr. Diesen Vorteil bestätigt auch eoda Chief Data Scientist Oliver Bracht: „Die Aufteilung in verschiedene Panels analog zu RStudio ist wirklich hilfreich. So kann man sich schneller auf das Wesentliche konzentrieren: Guten Code für die eigentliche Analyse zu schreiben. Die intuitive Aufteilung hilft mir zusätzlich bei der Entwicklung der Modelle.“

Jupyter notebook als perfekter Data-Science-Begleiter

Ein wichtiger, wenn nicht sogar der wichtigste Punkt bei Data Science: Explorative Datenanalyse. Und dafür sind Grafiken essentiell. Dank der Bibliothek Matplotlib in Jupyter lassen sich schnell und einfach Grafiken plotten und Präsentationen mithilfe von Markdowns erstellen, die anschließend als PDF oder HTML-File exportiert werden können – das erleichtert die Kommunikation mit anderen Abteilungen und Kunden enorm. Ergänzt wird die visuelle Komponente von der praktischen:  Der Funktionsumfang der Open-Source-IDE deckt jedes Bedürfnis eines Data Scientists ab und kombiniert dabei Code-Entwicklung mit Dokumentation – so steht einem guten Analyse-Projekt nichts mehr im Wege.

Python programmieren mit PyCharm

Nutzt man Python eher im Kontext der Softwareentwicklung und/oder arbeitet innerhalb größer angelegten Projekten, ist PyCharm die IDE der Wahl. Während der Programmierer mit Jupyter in nur einer einzigen Datei arbeitet, bietet PyCharm mehr Flexiblität beim Gesamtprojekt. Dabei ist eine Integration von Jupyter Notebooks problemlos möglich. Ein umfangreicher Debugger, die starke Code Completion, Git-Integration und Refactoring machen PyCharm  zu einem mächtigen Analyse-Tool. Ein weiteres Plus: Bei größeren Projekten behält man dank der IDE die Übersicht. Die kostenpflichtige Professional Edition wird noch von vielen weiteren nützlichen Funktionen ergänzt. Doch auch die kostenfreie Umgebung kann sich bereits sehen lassen. Durch verschiedene Erweiterungen und Integrationen ist ein Data-Science-Fokus zwar möglich, jedoch auch ein wenig umständlich – interaktives Code-Editing ist dabei die Schwachstelle. Nichtsdestotrotz sind die verschiedenen Plug-Ins hier Gold wert und können je nach User-Anforderung die einzelnen Bedürfnisse gut abdecken.

Es gibt noch weitere Entwicklungsumgebungen, die abhängig vom Anwendungsfall interessant sein könnten und mit eigenen Features auftrumpfen. Fest steht jedoch: Mit den genannten Oberflächen RStudio, Spyder, PyCharm und Jupyter ist jeder Data Scientist gut beraten – das nächste Analyse-Projekt kann also beginnen.


Tobias Titze - Beitrag vom 05.07.2018

Tobias Titze betreut seit 2013 das Marketing der eoda GmbH. Seine tägliche Aufgabe ist der Brückenschlag zwischen einem komplexen Thema und den Anforderungen des Marktes. Er interessiert sich für Daten und Algorithmen und begeistert sich für die Vorteile, die sich für Unternehmen daraus ergeben.

Abonnieren Sie unseren Datenanalyse-Blog