Der Datenanalyse-Blog von eoda

Der Datenanalyse-Blog vom Data Science Spezialisten: Hier erfahren Sie mehr über Data Science im Business-Kontext, Technologietrends, den Einsatz der Data-Science-Sprachen R und Python und vieles mehr.

Unsere Blogbeiträge

Ansible: Infrastruktur als Code

14. November 2019

Für die Entwicklung und Bereitstellung von IT-Systemen ist „Infrastructure as Code“ zu einem bedeutendem Schlüsselbegriff in der Welt der Systemadministration geworden. Dabei bezieht sich der Zusatz „as Code“ darauf, dass die Systeme nicht mehr manuell eingerichtet und konfiguriert sind, sondern mittels einer Skriptsprache entwickelt werden – auch im Data-Science-Kontext lassen sich dadurch schnell und einfach Test- und Produktivsysteme aufsetzen. In unserem Beitrag zeigen wir Ihnen wie sich Konfigurationsabläufe mittels Ansible automatisieren lassen.

Data Science horizontale Skalierung, symbolisiert durch Skyline mit Data Cloud

Kubernetes: Horiz. Skalierung von Data-Science-Apps in der Cloud

23. Oktober 2019

Vorhersagemodelle, Machine-Learning-Algorithmen und Skripte zur Datenhaltung: Die moderne Data-Science-Anwendung weist nicht nur zunehmend mehr Komplexität auf, sondern stellt auch immer mehr die bestehende Infrastruktur durch temporäre Ressourcenpeaks auf die Probe. In diesem Artikel wollen wir darstellen, wie man mit Tools, wie zum Beispiel dem RStudio Job-Launcher in Verbindung mit einem Kubernetes-Cluster, die Ausführung von beliebigen Analyseskripten in die Cloud auslagern, skalieren und in die lokale Infrastruktur zurückspielen kann.

R, Python & Julia in Data Science – Ein Vergleich

16. September 2019

„In welcher Programmiersprache soll entwickelt werden?“
Data Scientists stehen mittlerweile eine Auswahl an Programmiersprachen zur Verfügung. Jede einzelne besitzt unterschiedliche Eigenschaften. Daher eignen sich die einzelnen Sprachen ebenfalls für unterschiedliche Bereiche. Auch bei einer Implementierung der richtigen IT-Infrastruktur spielen Data-Science-Sprachen eine entscheidende Rolle.

Anomalierkennung: Welcher Algorithmus für Zeitreihen?

27. August 2019

Die Identifizierung und der richtige Umgang mit Anomalien haben branchenübergreifend eine große Bedeutung und sind die Basis für ein bis dato nicht mögliches vorausschauendes, wirtschaftliches Handeln.

Darstellung einer Zeitreihe mit Anomalien.

Mit Anomalieerkennung Maschinenausfälle vermeiden

22. August 2019

Was sind Datenausreißer? Geht man von einer beliebigen Datengrundlage aus, so spricht man von Ausreißern bzw. Anomalien, wenn Datenpunkte existieren, deren Ausprägungen sich signifikant von der Merkmalsverteilung der restlichen Datenpunkte unterscheiden.

Authentifizierung & Autorisierung für Dateninfrastrukturen

14. August 2019

Im Hinblick auf die Sensibilität der Daten, sind besondere Anforderungen notwendig, um den Datenschutz jederzeit zu wahren und die jeweils relevanten Informationen den Nutzern bereit zu stellen. Die Authentifizierung und Autorisierung sind die notwendige, technische Voraussetzung für den flächendeckenden Roll-out von Data-Science-Lösungen.

Client-Server-Architekturen für Data Science

23. April 2019

Data Science ist in vielen Branchen zu einem der entscheidenden Erfolgsfaktoren geworden. Um für Data Science reibungslose Arbeitsprozesse garantieren zu können, bedarf es der Implementierung einer Architektur, welche die Performance,…

IT-Infrastrukturen für Data Science

19. März 2019

Data Science, die Extraktion von Wissen aus Daten, ist in vielen Branchen zu einem der entscheidenden Erfolgsfaktoren geworden. Im Zuge der Digitalisierung fangen Unternehmen verstärkt an das Potenzial ihrer Daten…

Wie funktioniert Reinforcement Learning?

14. März 2019

Neben den bereits etablierten Klassen an Machine-Learning-Algorithmen des Supervised und Unsupervised Learnings, bietet das Reinforcement Learning einen neuen Ansatz.

Was sind Data-Science-Hackathons?

20. Februar 2019

Ihren Ursprung haben sie typischerweise in der Softwareentwicklung, doch auch im Bereich Data Science kommen sie immer häufiger zum Einsatz: Hackathons. Doch was genau ist eigentlich ein Hackathon? Was sind…

Moin Moin R – Programmieren in Hamburg

9. Januar 2019

Das Konzept aus Big Data werthaltige Informationen zu gewinnen, fordert leistungsfähige Statistik-Werkzeuge. Die freie Programmiersprache R ist eine der führenden Programmiersprachen, dessen Kernfunktionen in der statistischen Auswertung sowie der Visualisierung…

Ist der Weihnachtsmann berechenbar?

11. Dezember 2018

Vor zwei Jahren haben wir Sensationelles enthüllt: Der Weihnachtsmann ist ein Data Scientist. Nicht seine mehrere hundert Jahre umfassende Erfahrung als Geschenkbote, seine fliegenden Rentiere oder seine treuen Wichtel sind…