R-Akademie

Die R-Akademie von eoda ist ein modulares Trainingsprogramm für R, das praxisorientiert und umfassend die vielfältigen Möglichkeiten der Statistiksprache R behandelt. Mit dem R-Training von eoda stellen Sie sicher, dass Sie die richtigen Kenntnisse erwerben, um den maximalen Nutzen in der Anwendung von R zu erzielen.

 

Unsere Trainer arbeiten seit über 10 Jahre in der statistischen Datenanalyse. Unsere R-Trainings an Universitäten und Graduiertenzentren werden regelmäßig evaluiert und sehr gut bewertet. Eine Auswahl unserer Referenzen:

 

tl_files/medien/ReferenzenRTrainingeoda.jpg

 

Die Teilnehmer unserer R-Akademie kommen regelmäßig aus Öffentlichen Instituten, Forschungseinrichtungen oder Unternehmen verschiedenster Branchen. Auf Anfrage nennen wir Ihnen gerne passende Referenzen.

 

Thema Mai Juni September Oktober November
Einführung in R     02.09 bis 03.09    
Data Mining mit R 28.05 bis 29.05        
Statistische Testverfahren   12.06      
Multivariate Statistik mit R   13.06 bis 14.06      
Zeitreihenanalysen mit R     04.09 bis 05.09    
Grafikerstellung mit R       30.10 bis 31.10  
Interaktive Grafiken mit R         01.11
Qualitative Datenanalyse mit R         20.11 bis 21.11

Einführung in R

R ist eine Open Source Programmiersprache für statistische Datenanalyse und -visualisierung. Mittlerweile hat sich R, neben den kommerziellen Softwarelösungen SPSS (PASW), Stata und SAS, als Standardsoftware in Wissenschaft und Wirtschaft etabliert. 

R besteht aus einer Basisumgebung und einer großen Anzahl an "Paketen", mit denen sich praktisch alle Problemstellungen, die im weitesten Sinne mit Datenanalyse zu tun haben, lösen lassen. Das Anwendungsfeld reicht von den klassischen statistischen Verfahren der Soziologie und Psychologie über Simulationsverfahren, die Genomanalyse bis hin zu Text Mining. R bietet sich somit für empirische Fragestellungen, sowohl quantitative als auch qualitative, aus sämtlichen Fachgebieten an.

Der Kurs versteht sich als Einführung in die Grundfunktionen von R und soll Orientierung bieten, um sich im Dickicht der R-Pakete eigene Wege zu bahnen. Ziel ist es, mit praktischen Tipps den Einstieg zu erleichtern.

Kursinhalte:

  • Einstieg in R
    Das Programm R, CRAN-Mirror, verschiedene Umgebungen/Editoren von R , Nutzung der internen Hilfe-Funktionen, Hilfen im Internet
  • Konzept und Philosophie von R
    Die Programmiersprache, Objekte und Objektorientierung, Wertezuweisung, Funktionen
  • Variablentypen und ihre Eigenschaften
    Vektoren, Dataframes, Listen,…
  • Einlesen von Daten
    .txt-, .csv-, .xls-, .sav-Dateien, Internetquellen etc.
  • Datenmanagement
    Bildung neuer Variablen, bedingtes Umkodieren, einfache Berechnungen, fehlende Werte
  • Auswertungen mit R
    Statistische Kennzahlen, einfache Tabellen und Grafiken

 

Multivariate Statistik mit R

Regressionsanalyse

 

Die Regressionsanalyse zählt zu der am häufigsten verwendeten Analysefamilie. Grundprinzip ist die Analyse von Beziehungen und Zusammenhangsmaßen zwischen Variablen. Mit Hilfe der Regressionsanalyse kann nicht nur geklärt werden, ob ein Zusammenhang vorliegt, sondern auch wie stark der Zusammenhang insgesamt ist und welcher Einfluss den jeweiligen Variablen zukommt.

 

Faktorenanalyse

 

Ziel der Faktorenanalyse ist es, eine Vielzahl von Messwerten bzw. Items auf wenige, zentrale Faktoren zu verdichten. Die Grundidee ist, dass abstrakte und nicht direkt messbare Variablen durch eine Vielzahl von konkreten und messbaren Variablen repräsentiert werden. Die Faktorenanalyse kommt häufig in den Wirtschafts- und Sozialwissenschaften sowie in der Psychologie zum Einsatz, wenn es z.B. um die Messung von abstrakten Konstrukten wie „Zivilcourage“, „Fremdenfeindlichkeit“ oder „Beschäftigungsfähigkeit“ geht. Sie wird aber auch zur Lösung von naturwissenschaftlichen Problemstellungen eingesetzt.

 

Clusteranalyse

 

Bei der Clusteranalyse werden Gruppen gesucht, mit deren Hilfe sich Fälle (Befragte, Untersuchungsobjekte, Produkte, Wahlkreise, etc.) differenzieren lassen. Ziel ist es, die Gruppen so zu wählen, dass die Mitglieder innerhalb einer Gruppe möglichst homogen sind, die Mitglieder verschiedener Gruppe dagegen möglichst heterogen. Ein bekanntes Bespiel für eine Clusteranalyse sind die „Sinus-Milieus“ (http://www.sinus-institut.de/).

 

Kursinhalte:

  • Regressionsanalyse
    Modell und Ausgangspunkt, Interpretation und Güte, Anzahl der Regressoren, mögliche Probleme (Heteroskedastizität, Multikorrelarität, Autokorrelation, etc.)
  • Faktorenanalyse
    Ausgangspunkt, Theorie der Faktorenanalyse, Güte, Anzahl der zu extrahierenden Dimensionen, Rotation
  • Clusteranalyse
    Ausgangspunkt, Theorie, versch. Abstandsmaße, Interpretation

 

Statistische Testverfahren

Mit Hilfe von Hypothesentests wird untersucht, ob sich Unterschiede bzw. Zusammenhänge zwischen verschiedenen Variablen finden und ob diese unter Berücksichtigung einer akzeptablen Irrtumswahrscheinlichkeit zufällig oder systematisch sind. Je nach Natur der Ausgangsdaten werden unterschiedliche Testverfahren eingesetzt. In diesem Kurs werden die wichtigsten Verfahren vorgestellt.

 

Grafikerstellung mit R

R bietet umfangreiche Möglichkeiten zur Erzeugung publikationsreifer Grafiken zur ansprechenden Visualisierung der Ergebnis von Analyse.

Neben den Standardgrafiken von R werden in diesem Kurs auch spezielle Grafikpakete wie ggplot2, grid etc. und deren „Grammatik“ behandelt. Es wird umfangreich auf die vielen Einstellungsmöglichkeiten und Grafikoptionen eingegangen, so dass die Kursteilnehmer in der Lage sein werden individualisierte Grafiken zu erstellen.

Daneben werden die Exportmöglichkeiten (Devices) erläutert und es wird gezeigt, wie Sie Geodaten mit Hilfe von R visualisieren können.

  • Standardgrafiken
  • Grafikoptionen
  • Low-level Grafikelemente
  • Spezielle Grafikpakete (base, grid und ggplot2)
  • Geodaten visualisieren

 

Interaktive Grafiken mit R

Interaktive Grafiken sind ein flexibler und effizienter Weg um Daten zu analysieren und um Analyseergebnisse zu präsentieren. Interaktive grafische Anwendungen bieten Abfragen, Selektionen, Highlighting oder die Modifikation von Grafikparametern. Im Umfeld von R gibt es verschiedene Konzepte, die die Erstellung von interaktiven Grafiken und Anwendungen direkt aus R heraus möglich machen. Erwähnt seien hier IPlots oder shiny. Der Kurs gibt einen ersten Überblick über die Erstellung interaktiver Grafiken mit R und liefert das Rüstzeug, um selbst interaktive Visualisierungen in R zu realisieren.

 

Programmieren mit R

R bietet alle Vorteile einer höheren Programmiersprache. Durch die Verbindung von Statistik- und Grafikfunktionen mit Programmierelementen können regelmäßig wiederkehrende Skripteile elegant und effizient automatisiert werden. Auf unserer Results as a Service Plattform zeigen wir, wie sich R beispielsweise in eine Web-Anwendung integrieren läst.

 

Die Verwendung von Programmierelementen wird anhand von praxisnahen Beispielen erlernt. Ziel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke zugeschnitten anzuwenden.

Folgende Aspekte werden im Kurs behandelt:

  • Schleifen und Bedingungen
  • Die „apply“ Funktionsfamilie
  • Eigenen Funktionen schreiben
  • Das S3 Klassensystem
  • Metaprogrammierung
  • Parallelisierung
  • Einbindung anderer Programmiersprachen und des Betriebssystems

 

Data Mining mit R

Data Mining steht für das hypothesenfreie Extrahieren von  Erkenntnissen aus Daten. Statistische und mathematische Verfahren werden auf Datenbestände angewendet, um bestehende Muster und Zusammenhänge aufzudecken. Datamining Verfahren stellen i.d.R. geringe Anforderungen an das Messniveau der Daten (kategorial, ordinal, metrisch) und sind in der Lage komplexe nicht-lineare Zusammenhänge zu erkennen.  Konkrete Anwendung findet Data Mining beispielsweise bei der Erstellung von Prognose-Modellen, in der Zielgruppenanalyse, der Warenkorbanalyse, für Empfehlungsdienste und vielem mehr.

Folgende Methoden sind Teil des Kursprogramms:

  • Regressions- und Klassifikationsbäume
  • RandomForest
  • Künstliche Neuronale Netze
  • Support Vector Machines
  • K-Means Cluster

Die Anwendung der Datamining Verfahren wird anhand von praxisnahen Beispielen erlernt. Im Kurs wird sowohl die Erstellung von Datamining-Skripten als auch die Bedienung der graphischen Benutzeroberfläche „Rattle“ erlernt. Ziel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, das Gelernte selbständig auf ihre jeweiligen Anwendungszwecke zugeschnitten anzuwenden.

 

Qualitative Analyse mit R

Im Rahmen von quantitativen Analysen werden Daten standardisiert erhoben und mit statistischen Verfahren ausgewertet. Demgegenüber untersuchen qualitative Analysen Daten, die nicht standardisiert und in unstrukturierter Form vorliegen. R bieten alle Möglichkeiten auch unstrukturierte Inhalte wie Texte, Webseiten oder Content aus Social Media einzulesen und zu bearbeiten. Folgende Aspekte werden im Kurs behandelt:

 

  • Überblick über Text Mining
  • Einlesen von unstrukturierten Daten
  • Klassifikation von Dokumenten
  • Clustering
  • Assoziationsanalyse

 

Zeitreihenanalysen mit R

Für die Analyse von Zeitreihendaten stehen eine Reihe spezieller Analyseverfahren zur Verfügung. So lassen sich beispielsweise Zeitreihendaten in die Zukunft fortschreiben und die Konsequenzen unterschiedlicher Zukunfts-Szenarien schätzen. Weitere Anwendungsfälle sind die Berechnung der Wahrscheinlichkeit, dass ein Ereignis (z.B. der Ausfall eines Bauteils, die Bestellung eines Produkts etc.) in einer gegebenen Zeitspanne eintritt oder die Extraktion saisonaler Effekte in einem Prognosemodell. Neben den unten aufgeführten Aspekten werden im Kurs die Besonderheiten von Zeitreihendaten in klassischen Analysekontexten thematisiert.

 

  • Visualisierung von Zeitreihen
  • Forecasting
  • ARMA/ARIMA
  • Cox-Regression
  • Survival-Analyse (Kaplan-Meier)

 

Unterkunft und Anreise

Wir wünschen Ihnen eine gute Anreise! Gerne unterstützen wir Sie bei der Suche nach Hotels

Inhouse-Schulungen

Alternativ zur R-Akademie bieten wir unsere Schulungen auch bei Ihnen vor Ort oder per Web Conferencing an. Die Inhouse-Schulungen können individuell zusammengestellt und auf Ihre Bedürfnisse ausgerichtet werden. Gerne unterbreiten wir Ihnen hierzu ein Angebot.