Vom 25. bis 28. September fand in Heidelberg die data2day 2018 statt. Unter dem Motto „Technik und Wissen für datengetriebene Produkte“ versammelte die Konferenz rund 300 Data Scientists, Softwareentwickler und Data Engineers.

eoda Workshop zum Thema Data Science mit R auf der data2day 2018
eoda Workshop zum Thema Data Science mit R auf der data2day 2018

eoda war mit dem Workshop „Einführung in Data Science mit R“ vertreten. Unsere Umfrage der Vorkenntnisse zu Beginn des Workshops zeigte, dass ein Großteil der Teilnehmer fortgeschrittene Programmier- und Datenbanken-Kenntnisse besitzt. Ein Vorgeschmack auf den weiteren Verlauf der Konferenz, deren Talks überwiegend auf einem hohen inhaltlichen Niveau waren.

Selbsteinschätzung der Teilnehmer des R-Workshops hinsichtlich ihrer Vorkenntnisse.
Selbsteinschätzung der Teilnehmer des R-Workshops hinsichtlich ihrer Vorkenntnisse.

Data Science im Produktiveinsatz

Nach dem Workshop-Tag startete die Konferenz mit einer Keynote von Ted Dunning. Ted Dunning, Chief Application Member bei MapR und Boardmember der Apache Software Foundation, sagt von sich selbst, dass er schon seit Pre-Internet Tagen im Open-Source-Umfeld tätig sei. In seiner Keynote sprach er Themen an, die im Laufe der Konferenz immer wieder auftauchen sollten: Der Unterschied zwischen klassischer Softwareentwicklung und Data Science und die Herausforderungen des produktiven Einsatzes von Daten Produkten. Während seiner Keynote rief er u.a. dazu auf, sich mehr mit der Kontrolle und Versionierung von Daten zu beschäftigen.

Während der zweiten Keynote von Mikio Braun, AI Architect bei Zalando, wurde per Handzeichen die Zusammensetzung der Teilnehmer ermittelt. Etwas mehr als die Hälfte der Teilnehmer bezeichneten sich selbst als Data Scientist, etwas weniger als Softwareentwickler.

Ein Aspekt der Keynote von Mikio Braun: Die Verteilung der Arbeitslast zwischen Data Science und Softwareentwicklung in unterschiedlichen Projektphasen.

data2day 2018: Thematisch vielfältig

Die inhaltliche Vielfalt reichte von methodischen Vorträgen über Infrastrukturthemen  bis hin zu Themen wie der DSGVO oder der Analyse von Echokammern in den Kommentaren von YouTube. Der Vortrag „Smart Matching: Datenintegration mit Advanced Analytics“ machte die Bandbreite der Konferenz gut deutlich: Hier wurde von der Use-Case-Definition (Vereinheitlichung von Daten aus unterschiedlichen Excelformaten in einem standardisierten Datenformat) bis hin zum produktiven Einsatz der Lösung (in Form einer Webapp) der komplette Zyklus eines Data-Science-Projekts vorgestellt.

Der Veranstaltungsort der data2day: Die Print Media Academy in Heidelberg.
Der Veranstaltungsort der data2day: Die Print Media Academy in Heidelberg.

Sehr präsent war dieses Jahr die Frage der organisatorischen Verortung von Data-Science-Teams im Unternehmen. Mikio Braun und Stefan Kühn (xing) plädierten in ihren Talks für einen crossfunktionalen Einsatz von Data Science in interdisziplinären Teams.

Abschließend lässt sich sagen, dass es sich bei der data2day um eine sehr gut organisierte Konferenz mit einem breiten und inhaltlich hochwertigen Programm rund um das Thema Data Science handelt.