Unsere Blogbeiträge
Shiny: Load Testing und Horizontale Skalierung
Shiny: Load Testing und Horizontale Skalierung „Money can’t buy you happiness, but it can buy you more EC2-Instances…“- Mit diesem Satz läutete Sean Lopp, Product Manager bei RStudio, PBC, seinen „Scaling Shiny“ Showcase ein. In diesem zeigt er mittels eines Load-Testing-Ansatzes, wie eine Shiny-Applikation für 10.000 Nutzer skaliert werden kann. RStudio’s hauseigenes WebApp-Framework shiny ist […]
Die 5 Data Science Trends 2020
Die 5 Data Science Trends 2020 In unseren Data-Science-Projekten stützen wir Vorhersagen über die Zukunft stets auf Daten. Für die Prognose der Data Science Trends 2020 haben wir unsere Erkenntnisse aus dem Austausch mit Kunden und Partnern mit unserer mittlerweile über 10 Jahre gereiften Intuition für die kommenden Themen unserer Branche verbunden. Das Ergebnis? Die […]
Data Science Konferenzen 2020
Data Science und KI: Konferenzen 2020 Sie bewegen den gesellschaftlichen Diskurs und sind das drängendste Thema auf der Agenda vieler Unternehmen: Künstliche Intelligenz und Data Science. Damit einher geht natürlich auch die immer größere Präsenz dieser Themen auf Messen und Konferenzen. Sprechen Sie uns an Wir blicken für Sie voraus, auf wichtige Data-Science-Konferenzen 2020 im […]
Ansible: Infrastruktur als Code
Für die Entwicklung und Bereitstellung von IT-Systemen ist „Infrastructure as Code“ zu einem bedeutendem Schlüsselbegriff in der Welt der Systemadministration geworden. Dabei bezieht sich der Zusatz „as Code“ darauf, dass die Systeme nicht mehr manuell eingerichtet und konfiguriert sind, sondern mittels einer Skriptsprache entwickelt werden – auch im Data-Science-Kontext lassen sich dadurch schnell und einfach Test- und Produktivsysteme aufsetzen. In unserem Beitrag zeigen wir Ihnen wie sich Konfigurationsabläufe mittels Ansible automatisieren lassen.
Kubernetes: Horiz. Skalierung von Data-Science-Apps in der Cloud
Vorhersagemodelle, Machine-Learning-Algorithmen und Skripte zur Datenhaltung: Die moderne Data-Science-Anwendung weist nicht nur zunehmend mehr Komplexität auf, sondern stellt auch immer mehr die bestehende Infrastruktur durch temporäre Ressourcenpeaks auf die Probe. In diesem Artikel wollen wir darstellen, wie man mit Tools, wie zum Beispiel dem RStudio Job-Launcher in Verbindung mit einem Kubernetes-Cluster, die Ausführung von beliebigen Analyseskripten in die Cloud auslagern, skalieren und in die lokale Infrastruktur zurückspielen kann.
R, Python & Julia in Data Science – Ein Vergleich
„In welcher Programmiersprache soll entwickelt werden?“
Data Scientists stehen mittlerweile eine Auswahl an Programmiersprachen zur Verfügung. Jede einzelne besitzt unterschiedliche Eigenschaften. Daher eignen sich die einzelnen Sprachen ebenfalls für unterschiedliche Bereiche. Auch bei einer Implementierung der richtigen IT-Infrastruktur spielen Data-Science-Sprachen eine entscheidende Rolle.
Anomalierkennung: Welcher Algorithmus für Zeitreihen?
Die Identifizierung und der richtige Umgang mit Anomalien haben branchenübergreifend eine große Bedeutung und sind die Basis für ein bis dato nicht mögliches vorausschauendes, wirtschaftliches Handeln.
Mit Anomalieerkennung Maschinenausfälle vermeiden
Was sind Datenausreißer? Geht man von einer beliebigen Datengrundlage aus, so spricht man von Ausreißern bzw. Anomalien, wenn Datenpunkte existieren, deren Ausprägungen sich signifikant von der Merkmalsverteilung der restlichen Datenpunkte unterscheiden.
Authentifizierung & Autorisierung für Dateninfrastrukturen
Im Hinblick auf die Sensibilität der Daten, sind besondere Anforderungen notwendig, um den Datenschutz jederzeit zu wahren und die jeweils relevanten Informationen den Nutzern bereit zu stellen. Die Authentifizierung und Autorisierung sind die notwendige, technische Voraussetzung für den flächendeckenden Roll-out von Data-Science-Lösungen.
Starten Sie jetzt durch:
Wir freuen uns auf den Austausch mit Ihnen.










