Unsere Blogbeiträge
Ansible: Infrastruktur als Code
Für die Entwicklung und Bereitstellung von IT-Systemen ist „Infrastructure as Code“ zu einem bedeutendem Schlüsselbegriff in der Welt der Systemadministration geworden. Dabei bezieht sich der Zusatz „as Code“ darauf, dass die Systeme nicht mehr manuell eingerichtet und konfiguriert sind, sondern mittels einer Skriptsprache entwickelt werden – auch im Data-Science-Kontext lassen sich dadurch schnell und einfach Test- und Produktivsysteme aufsetzen. In unserem Beitrag zeigen wir Ihnen wie sich Konfigurationsabläufe mittels Ansible automatisieren lassen.
Kubernetes: Horiz. Skalierung von Data-Science-Apps in der Cloud
Vorhersagemodelle, Machine-Learning-Algorithmen und Skripte zur Datenhaltung: Die moderne Data-Science-Anwendung weist nicht nur zunehmend mehr Komplexität auf, sondern stellt auch immer mehr die bestehende Infrastruktur durch temporäre Ressourcenpeaks auf die Probe. In diesem Artikel wollen wir darstellen, wie man mit Tools, wie zum Beispiel dem RStudio Job-Launcher in Verbindung mit einem Kubernetes-Cluster, die Ausführung von beliebigen Analyseskripten in die Cloud auslagern, skalieren und in die lokale Infrastruktur zurückspielen kann.
R, Python & Julia in Data Science – Ein Vergleich
„In welcher Programmiersprache soll entwickelt werden?“
Data Scientists stehen mittlerweile eine Auswahl an Programmiersprachen zur Verfügung. Jede einzelne besitzt unterschiedliche Eigenschaften. Daher eignen sich die einzelnen Sprachen ebenfalls für unterschiedliche Bereiche. Auch bei einer Implementierung der richtigen IT-Infrastruktur spielen Data-Science-Sprachen eine entscheidende Rolle.
Anomalierkennung: Welcher Algorithmus für Zeitreihen?
Die Identifizierung und der richtige Umgang mit Anomalien haben branchenübergreifend eine große Bedeutung und sind die Basis für ein bis dato nicht mögliches vorausschauendes, wirtschaftliches Handeln.
Mit Anomalieerkennung Maschinenausfälle vermeiden
Was sind Datenausreißer? Geht man von einer beliebigen Datengrundlage aus, so spricht man von Ausreißern bzw. Anomalien, wenn Datenpunkte existieren, deren Ausprägungen sich signifikant von der Merkmalsverteilung der restlichen Datenpunkte unterscheiden.
Authentifizierung & Autorisierung für Dateninfrastrukturen
Im Hinblick auf die Sensibilität der Daten, sind besondere Anforderungen notwendig, um den Datenschutz jederzeit zu wahren und die jeweils relevanten Informationen den Nutzern bereit zu stellen. Die Authentifizierung und Autorisierung sind die notwendige, technische Voraussetzung für den flächendeckenden Roll-out von Data-Science-Lösungen.
Client-Server-Architekturen für Data Science
Data Science ist in vielen Branchen zu einem der entscheidenden Erfolgsfaktoren geworden. Um für Data Science reibungslose Arbeitsprozesse garantieren zu können, bedarf es der Implementierung einer Architektur, welche die Performance,…
IT-Infrastrukturen für Data Science
Data Science, die Extraktion von Wissen aus Daten, ist in vielen Branchen zu einem der entscheidenden Erfolgsfaktoren geworden. Im Zuge der Digitalisierung fangen Unternehmen verstärkt an das Potenzial ihrer Daten…
Wie funktioniert Reinforcement Learning?
Neben den bereits etablierten Klassen an Machine-Learning-Algorithmen des Supervised und Unsupervised Learnings, bietet das Reinforcement Learning einen neuen Ansatz.
Was sind Data-Science-Hackathons?
Ihren Ursprung haben sie typischerweise in der Softwareentwicklung, doch auch im Bereich Data Science kommen sie immer häufiger zum Einsatz: Hackathons. Doch was genau ist eigentlich ein Hackathon? Was sind…
Moin Moin R – Programmieren in Hamburg
Das Konzept aus Big Data werthaltige Informationen zu gewinnen, fordert leistungsfähige Statistik-Werkzeuge. Die freie Programmiersprache R ist eine der führenden Programmiersprachen, dessen Kernfunktionen in der statistischen Auswertung sowie der Visualisierung…
Starten Sie jetzt durch:
Wir freuen uns auf den Austausch mit Ihnen.
