Python Data Science Training

Data Science mit Python

Lernen Sie, wie Sie Python optimal im Kontext von Big Data und Machine Learning einsetzen können

Python ist eine der führenden Programmiersprachen zur Datenanalyse. In unseren Python-Schulungen geben wir Ihnen einen praxisnahen Einblick in den Funktionsumfang der Universalsprache im Analytik-Bereich. Lernen Sie mit uns, wie Sie vom Datenmanagement über die Entwicklung von Analysemodellen bis zur Datenvisualisierung den gesamten Data-Science-Workflow mit Python realisieren können. 

 

Einführung in Data Science mit Python

Die Grundlagenschulung in Python mit dem Fokus auf den Bereich Data Science ist der ideale Einstieg für Analysten in die Programmiersprache. Neben den Programmierparadigmen, Objekttypen und Syntaxstrukturen wird mit pandas die zentrale Bibliothek für den Bereich Datenmanagement besprochen. Durch das Training werden die Teilnehmer in der Lage sein, das Datenmanagement sowie erste Analysen und Visualisierungen in Python umzusetzen.  

Kursinhalte

  • Das Konzept und die Philosophie von Python
  • Übersicht über die Python-Editoren, u.a.: Jupyter, Pycharm, Spyder
  • Python-Projekte anlegen: Ordnerstruktur, Einbinden von Paketen und Modulen
  • Die Python-Hierarchie: Pakete, Module, Klassen, Funktionskonstrukte und Quellcode
  • Datenstrukturen und ihre Eigenschaften
  • Funktionen und Kontrollstrukturen
  • Einstieg in die Objektorientierung: Klassen, Methoden und Attribute
  • pandas
    • Objekttypen: Series und Data Frame
    • Datenmanagement, deskriptive Statistik, erste Visualisierungen

 

Machine Learning mit Python

Ziel des Kurses ist es, Machine-Learning-Verfahren durch deren Anwendung an praxisnahen Übungsdatensätzen zu erlernen. Während des Trainings werden die zentralen Schritte, wie das vorbereitende Datenmanagement, das Trainieren der Algorithmen sowie die Prognoseerstellung und Validierung erlernt und direkt in Python umgesetzt. Einen besonderen Fokus richtet der Kurs auf die Python-Bibliothek scikit-learn, welche eine Vielzahl populärer Algorithmen im Bereich Machine Learning umfasst.

Während des Kurses werden Python-Skripte erstellt, die den Teilnehmern als Vorlage für eigene Machine-Learning-Anwendungen dienen können.

  • Grundlagen des Machine Learnings / Data Minings
    • Überblick über Modelle und Methoden, über das Problem der Prognose
    • Supervised vs. Unsupervised Learning
  • Overfitting ,Underfitting und Parametertuning – Techniken der Modellerstellung
    • Grundproblem, einfache Kreuzvalidierung, 3 Fold-Technik, k-Fold-Validierung, Kreuzvalidierung bei Zeitreihen
  • Klassifikationsverfahren
    • Entscheidungsbäume, Random Forest, Gradient Boosting Machines, Neuronale Netze, Support Vector Machines
    • Evaluation von Klassifikationsverfahren (ROC-Kurven, Cutoff-Wert, Präzision, Sensitivität, Spezifität)
  • Regressionsprobleme
    • Lineare Regression, Regression Trees, Neuronale Netze, Support Vector Machines, Random Forest
    • Evaluation von Regressionsproblemen
  • Clusteranalysen
    • k-nearest neighbors, k-Means, Agglomerative Clusteranalyse, Visualisierungen

 

Sie haben Interesse an unseren Python-Schulungen? Sprechen Sie uns an - wir unterbreiten Ihnen gerne ein individuelles Angebot für ein Inhouse-Training.

Telefonisch unter +49 561 202724-51 oder nutzen Sie unser Kontaktformular:

eoda GmbH | Universitätsplatz 12 | 34127 Kassel | +49 561 202724-40 | info@eoda.de
© eoda 2018 Datenschutz und Impressum