In einem kürzlich erschienenen Blogartikel berichtet Joseph Rickert von Microsoft von den Ergebnissen einer aktuellen Untersuchung zur Beliebtheit von R, SAS und Python. Rickert bezieht sich dabei auf eine jährlich durchgeführte Studie der amerikanischen Recruiting Agentur Burtch Works zur Nutzung von Analysetools. Über 1.100 professionelle Data Scientists und Analysten wurden gefragt, welches analytische Werkzeug sie bevorzugen: SAS, R oder Python.

Insgesamt3

Mit 42% hat Open Source R zum ersten Mal den Konkurrenten SAS überholt. Dies bestätigt den Trend der letzten Jahre, in denen R zunehmend an Bedeutung gewinnt. In diesem Jahr stand auch erstmals die freie Programmiersprache Python zur Wahl und erreichte mit 20% gut die Hälfte der Beliebtheit von SAS. Die Entwicklung seit der ersten Studie in 2014 zeigt, dass Open Source Tools insgesamt immer beliebter werden, allen voran R. Gerade bei professionellen Datenanalysten mit hohem Bildungsabschluss liegt R weit vorne.

Ab

Unterschiede in der Popularität der Tools ergeben sich auch in Bezug auf die Berufserfahrung der Nutzer: SAS wird vor allem von Analysten mit mehr als 16 Jahren Erfahrung bevorzugt. Die Beliebtheit von R und Python ist hingegen bei denjenigen mit weniger als 5 Jahren Erfahrung am größten. Das zeigt deutlich, dass Hochschulabsolventen zunehmend R Expertise mitbringen und diese produktiv in ihren Unternehmen einsetzen.

Erfahrung

Zudem wurde zwischen den Anwendungsbereichen Data Science und Predictive Analytics differenziert. Während es bei Predictive Analytics nur eine kleine Abweichung zwischen SAS und R gibt, so ist der Unterschied bei den Data Scientists sehr deutlich: gerade einmal 3% von ihnen nutzen bevorzugt SAS.

DSvsPA2

Eine im Juni erschienene Untersuchung von Bob Muenchen kommt zu einem ähnlichen Ergebnis. Demnach wurde R im Jahr 2015 erstmals häufiger in wissenschaftlichen Veröffentlichungen verwendet als SAS. Im Vergleich mit dem Vorjahr zeichnet sich ein deutlicher Trend ab: Während das Vorkommen von R in wissenschaftlichen Artikeln deutlich angestiegen ist, ist die Häufigkeit sowohl von SAS als auch von SPSS stark gesunken. Sollte der derzeitige Trend anhalten, so würde R laut Muenchen bis Ende nächsten Jahres an SPSS vorbeiziehen und die Nummer-1-Software für die wissenschaftliche Nutzung von Data Science werden.

Häufigkeit von R in wissenschaftlichen Artikeln (Bildquelle: Bob Muenchen)
Häufigkeit von R in wissenschaftlichen Artikeln (Bildquelle: Bob Muenchen)
Die Erkenntnisse beider Untersuchungen lassen keinen Zweifel an der steigenden Popularität der freien Programmiersprache R. Für mehr Informationen zu R:

Hier entlang.