Schulung zur multivariaten Statistik mit R

Multivariate Statistik mit R

In diesem Kurs lernen Sie Analyseverfahren kennen, die es Ihnen ermöglichen, statistische Zusammenhänge und Muster in ihren Daten aufzudecken. Im Mittelpunkt stehen dabei drei klassische Verfahren der multivariaten Statistik: Regressionsanalyse, Clusteranalyse und Faktorenanalyse.

Die lineare Regressionsanalyse ermöglicht Ihnen die Modellierung von Zusammenhängen und Einflüssen verschiedener Faktoren auf eine bestimmte Zielgröße. Welchen Einfluss hat das Wetter auf meine Verkaufszahlen? Welche Vertriebskanäle sind am erfolgreichsten?

Mit der Clusteranalyse können verborgene Ähnlichkeiten zwischen Beobachtungen aufgedeckt werden. Das Ziel besteht darin, innerhalb der Stichprobe Gruppen zu identifizieren, die in sich homogen sind und sich gleichzeitig gut von den übrigen Gruppen abgrenzen lassen. Ein klassischer Anwendungsfall ist die Kundensegmentierung.

Die Faktorenanalyse ist immer dann interessant, wenn Informationen aus verschiedenen Messwerten verdichtet werden müssen. Diese Form der statistischen Informationsverdichtung wird in verschiedenen Anwendungsbereichen genutzt: in psychologischen und sozialwissenschaftlichen Analysen zur Messung abstrakter Konstrukte wie „Zivilcourage“, im technischen Bereich zur Bild- oder Signalverarbeitung. Wieder andere Anwendungen finden sich im Bereich Anomaly Detection.

Der Kurs versteht sich als anwendungsorientierte Einführung in die drei oben genannten Verfahren, wobei der Fokus auf der Anwendung in R liegt. Der Kurs richtet sich an Interessenten, die bereits über grundlegende R- und Statistikkenntnisse verfügen.

 

Kursinhalte

Clusteranalyse:

  • Grundlegende Konzepte der Clusteranalyse

Ähnlichkeit/Unähnlichkeit und Fusionierung

  • Bestimmung der Ähnlichkeit

Diskussion gängiger Ähnlichkeits- und Distanzmaße

  • Hierarchisch-Agglomerative Fusionierungsalgorithmen

Vergleich zwischen verschiedenen Algorithmen

  • Partitionierende Fusionierungsalgorithmen

kMeans-Algorithmus

  • Interpretation und Visualisierung

Bestimmung der Clusteranzahl

Bewertung der Clusterlösung

Visualisierung mittels Dendrogramm und Profilplots

Regressionsanalyse:

  • Einführung in die lineare Regressionsanalyse

Binäre lineare Regression, multiple lineare Regression

  • Interpretation

Modellkoeffizienten, Signifikanztests, Modellgüte

  • Modelldiagnostik

Grafische und statistische Überprüfung von Modellvoraussetzungen

  • Fortgeschrittene Modellierung

Nicht-lineare Effekte & Interaktionseffekte

Automatisierte Modellierung mittels Stepwise Regression

  • Sonstiges

Umgang mit fehlenden Werten, Imputation fehlender Werte

Identifizierung von Ausreißern

Faktorenanalyse:

  • Grundidee der Faktorenanalyse

Hauptkomponentenanalyse/Principal Component Analysis (PCA)

Hauptachsenanalyse

  • Ablauf einer Faktorenanalyse

Dateninspektion, Bestimmung der Faktorenanzahl, Rotation

  • Interpretation und Bewertung

Faktorladungen, Kommunalitäten und reproduzierte Varianz

 

Nächster Termin

Individuelle Termine auf Anfrage möglich.

Kursdauer: Zwei Tage

Ort

Der Kurs wird in unseren Schulungsräumen in Kassel stattfinden. Es besteht eine gute Anbindung mit dem Auto und mit den öffentlichen Verkehrsmitteln.

Preis für beide Tage

  • Basispreis € 1.100,-
  • Hochschulmitglieder € 660,-

Preise pro Person und zzgl. MwSt.

eoda GmbH | Universitätsplatz 12 | 34127 Kassel | +49 561 202724-40 | info@eoda.de
© eoda 2017 Datenschutz und Impressum