Training: Data Science mit Spark

Performant und schnell: Optimieren Sie mit Spark Ihre Analysen

Sie arbeiten mit komplexen Machine-Learning-Modellen und umfangreichen Datenmengen? Dann ist Apache Spark als Cluster-Computing-Engine mit In-Memory-Berechnungen Ihr Performance-Boost. Spark ermöglicht es Ihnen, auch im Big-Data-Umfeld Datenabfragen performant durchzuführen und ist durch seine Machine-Learning-Bibiliotheken und zahlreichen Schnittstellen eine der führenden Analytics-Technologien.

Die Zusammenführung unterschiedlicher Datenquellen, interaktive Analysen oder Echtzeit-Daten: Schnell und parallelisiert verarbeitet Spark große Datenmengen und unterstützt damit auch komplexe Algorithmen des maschinellen Lernens optimal.

In unserem Training „Data Science mit Spark“ vermitteln wir Ihnen die Grundlagen für Ihre Arbeit mit Spark und legen den Fokus auf das Zusammenspiel von Spark mit den Data-Science-Sprachen Python und R. Wir empfehlen diesen Kurs für erfahrene Python- und R-User und Einsteiger gleichermaßen.

Data Science mit Spark: Die Kursinhalte

  • Einlesen und Repartitionierung von Daten auf einem Spark-Cluster
  • Einführung in das Datenmanagement
  • Austausch zwischen lokalen R/Python-Sessions und Clusteroperationen
  • Einführung in das Machine Learning mit Spark

 

Die Key Facts zu unserem Spark-Training


Programmiersprache


Sie haben die Wahl: Diese Schulung bieten wir Ihnen mit einem Fokus auf Python (PySpark) oder R (sparklyr) an.

Umfang


Die empfohlene Kurslänge beträgt einen Tag. Sehr gerne stellen wir Ihnen auch ein Individualtraining zusammen.

Durchführung


Diesen Kurs bieten wir Ihnen zu Ihrem Wunschtermin an - Inhouse oder als Remote-Training. Sehr gerne schulen wir Sie auch in englischer Sprache.

Lassen Sie sich Ihr Angebot erstellen.
Ihre Ansprechpartnerin: Meltem Hekim

Kontakt aufnehmen
Portraitfoto Meltem Hekim