Predictive Analytics mit Hilfe von Random Forest am Beispiel einer Win-Loss-Analyse

Um zukünftige Ereignisse zu prognostizieren, ist die Transparenz über vorhandene Kausalzusammenhänge, komplexe Beziehungen und indirekte Abhängigkeiten einzelner Faktoren untereinander sehr hilfreich. Datenmengen, die ohnehin vielfach vorhanden sind, machen es möglich, solche Zusammenhänge aufzudecken. Statistische Methoden wie das Random Forest Verfahren ermöglichen eine fundierte Analyse und liefern nachvollziehbare Ergebnisse, die sich plakativ darstellen lassen.

Analytisches CRM: Win-Loss-Analyse mit Hilfe des Random Forest Verfahren

Am Beispiel einer Win-Loss-Analyse lässt sich zeigen, wie Predictive Analytics mit Hilfe eines Ursache-Wirkungmodells funktioniert. Die Grundlage der Analyse bilden Vertriebsdaten aus einem CRM-System. Es können beliebig Daten aus unterschiedlichen Ebenen bzw. Entitäten (Accounts, Kontakte, Verkaufschancen etc.) aufgenommen und berücksichtigt werden. Auch externe Daten, zum Beispiel zur Wirtschafts- oder Wetterlage, können in ein solches Modell aufgenommen werden.

Die Kausalzusammenhänge werden mit Hilfe des Random Forest Verfahrens modelliert und analysiert. Die folgende Grafik veranschaulicht die Ergebnisse anhand eines einzelnen Regressionsbaumes. Die Grafik verdeutlicht, dass bestimmte Merkmale und Merkmalkombinationen der Kunden Einfluss auf die Erfolgswahrscheinlichkeiten der Angebote haben.

Über alle Angebote hinweg lag die Win-Quote bei 28%. Bestimmte Merkmalskombinationen der Kunden wirkten sich auf die Erfolgswahrscheinlichkeit wie folgt aus:

Höhere Erfolgsaussichten haben

  • Angebote mit einem Volumen bis zu 10.000 € an Kunden, die in der Vergangenheit mindestens drei Projekte gekauft haben (53%).
  • Angebote mit einem Volumen mehr als 50.000 € an Kunden, die in der Vergangenheit mindestens drei Projekte gekauft haben (42%).
  • Angebote mit einem Volumen mehr als 20.000 € an Kunden, die in der Vergangenheit weniger als drei Projekte gekauft haben und die in den Branchen Handel oder Industrie tätig sind (36%).

Geringere Erfolgsaussichten haben

  • Angebote an Kunden aus den Bereichen öffentliche Verwaltung und Dienstleistung, die in der Vergangenheit weniger als drei Projekte gekauft haben (9%).
  • Angebote mit einem Volumen von weniger als 20.000 € an Kunden aus den Bereichen Handel und Industrie, die in der Vergangenheit weniger als drei Projekte gekauft haben (12%).

Der Nutzen von Predictive Analytics im Vertrieb

Auf Basis dieser Erkenntnisse können zukünftige Erfolgswahrscheinlichkeiten prognostiziert werden. Zusätzlich kann die Vertriebsstrategie basierend auf den Erkenntnissen, die aus der statistischen Analyse der Vertriebsdaten resultieren, optimiert werden. In Zukunft könnten Angebote bevorzugt nachverfolgt werden, die größere Erfolgswahrscheinlichkeiten haben. Das Verhältnis von Vertriebsaufwand und Auftragseingang ließe sich auf diese Weise optimieren.

Der Erfolg der strategischen Maßnahme sollte dann kontinuierlich kontrolliert und evaluiert werden. So lässt sich nachweisen, ob die Änderung der Vertriebsstrategie in einem gegebenen Zeitraum tatsächlich die erwarteten Erfolge gebracht hat.  Das Modell sollte regelmäßig neu evaluiert werden. Nicht zuletzt, um nicht intendierte Nebenfolgen aus einem geänderten Vorgehen zu erkennen.

Anwendungsbeispiele für Predictive Analytics

Eine Zeitung möchte Abonnenten identifizieren, die ein hohes Kündigungsrisiko aufweisen. Dazu werden die Kündigungen der Vergangenheit analysiert und das individuelle Kündigungsrisiko abgeleitet. Ist das Risiko hoch, werden proaktiv Gegenmaßnahmen eingeleitet. Die Kündigungsquote kann so gesenkt werden.

Ein Café möchte die Nachfrage nach leicht verderblichem Kuchen vorhersagen. Einflussvariablen sind der Wochentag, das vorhergesagte Wetter, Temperatur und Sonnenstunden während der vergangenen 14-Tage, lokale Veranstaltungen (Flohmärkte, Stadtfeste etc.) und Werbemaßnahmen der Café-Kette. Die Prognose verhindert hohen Ausschuss einerseits und ein zu geringes Angebot bei hoher Nachfrage andererseits.

Das Marketingbüro einer Großstadt benötigt eine Prognose über die der Anzahl der Touristen, die an bestimmten Tagen (Monaten) Sightseeing-Bustouren in Anspruch nehmen werden, um die Zahl der benötigten Busse & Fahrer zu schätzen. Einflussvariablen sind Jahreszeit, Ferienpläne, Fernsehberichte über die Region, überregionale Ereignisse (Messen, Großveranstaltungen), Flug- und Bahntarife usw. Anhand der soliden Schätzung können die Kosten für den Sightseeing Service erheblich reduziert und die Servicequalität für die Touristen erhöht werden.


Heiko Miertzsch - Beitrag vom 13.02.2013

Heiko Miertzsch ist einer der beiden Gründer der eoda GmbH.

Abonnieren Sie unseren Datenanalyse-Blog