In diesem Kurs lernen Sie Analyseverfahren kennen, die es Ihnen ermöglichen, statistische Zusammenhänge und Muster in ihren Daten aufzudecken. Im Mittelpunkt stehen dabei drei klassische Verfahren der multivariaten Statistik: Regressionsanalyse, Clusteranalyse und Faktorenanalyse.
Die lineare Regressionsanalyse ermöglicht Ihnen die Modellierung von Zusammenhängen und Einflüssen verschiedener Faktoren auf eine bestimmte Zielgröße. Welchen Einfluss hat das Wetter auf meine Verkaufszahlen? Welche Vertriebskanäle sind am erfolgreichsten?
Mit der Clusteranalyse können verborgene Ähnlichkeiten zwischen Beobachtungen aufgedeckt werden. Das Ziel besteht darin, innerhalb der Stichprobe Gruppen zu identifizieren, die in sich homogen sind und sich gleichzeitig gut von den übrigen Gruppen abgrenzen lassen. Ein klassischer Anwendungsfall ist die Kundensegmentierung.
Die Faktorenanalyse ist immer dann interessant, wenn Informationen aus verschiedenen Messwerten verdichtet werden müssen. Diese Form der statistischen Informationsverdichtung wird in verschiedenen Anwendungsbereichen genutzt: in psychologischen und sozialwissenschaftlichen Analysen zur Messung abstrakter Konstrukte wie „Zivilcourage“, im technischen Bereich zur Bild- oder Signalverarbeitung. Wieder andere Anwendungen finden sich im Bereich Anomaly Detection.
Der Kurs versteht sich als anwendungsorientierte Einführung in die drei oben genannten Verfahren, wobei der Fokus auf der Anwendung in R liegt. Der Kurs richtet sich an Interessenten, die bereits über grundlegende R- und Statistikkenntnisse verfügen.
Die Kursinhalte im Überblick:
Clusteranalyse:
- Grundlegende Konzepte der Clusteranalyse
- Ähnlichkeits- und Distanzmaße
- Vergleich und Anwendung verschiedener Algorithmen
Regressionsanalyse:
- Einführung in die lineare Regressionsanalyse
- Modellkoeffizienten, Signifikanztests, Modellgüte
- Grafische und statistische Überprüfung von Modellvoraussetzungen
- Berücksichtigung nicht linearer Effekte und Interaktionseffekte
- Automatisierte Modellierung mittels Stepwise Regression
Faktoren und Hauptkomponentenanalyse (PCA):
- Einführung in die Verfahren
- Ablauf einer Faktorenanalyse
- Dateninspektion, Bestimmung der Faktorenanzahl, Rotation
- Faktorladungen, Kommunalitäten und reproduzierte Varianz
—
Empfohlene Kurslänge: Zwei Tage