Augmented Analytics – Umsetzung und Anwendung

Lesezeit: ca. 5min

Die Vorteile von Augmented-Analytics-Systemen lassen sich wie folgt zusammenfassen:

Machine Learning-Algorithmen unterstützen Business-Anwender bei der Identifikation und Visualisierung relevanter Datenquellen
Informationen sind schneller verfügbar und lassen sich in einem breiteren Kontext verstehen, wodurch das Verständnis von Zusammenhängen wächst
Anwender können Datenanalysen dank AutoML Modellen selbstständig entwickeln und produktiv einsetzen bzw. Geschäftsprozesse mit diesen Analysen beeinflussen bzw. optimieren.
Vorschläge bei der Dashboard-Gestaltung und der Visualisierung geschehen durch das System
Aktionen lassen sich automatisieren und aus einem Augmented-Analytics-System heraus steuern
Ergebnis: Weniger Zeitaufwand, bei gleichzeitigem Erkenntnisgewinn und der Ableitung konkreter Handlungen.

Augmented Analytics Systeme unterstützen auf vielfältige Weise

In einem vorherigen Artikel sind wir auf die Grundlagen und Unterschiede zwischen BI-Tools und Augmented Analytics eingegangen. Zur Erinnerung: Augmented Analytics Systeme konsolidieren die gesammelten Informationen eines Unternehmens innerhalb der gesamten Wertschöpfungskette. Nahezu jedes Unternehmen besitzt Tools die Informationen entlang der gesamten Wertschöpfungskette über die Produktion, Mitarbeiterskill, Produkte, Lieferfanten, Kunden und den Markt sammeln.

Woran es fehlt, sind aber oft die Skills diese Informationen zu konsolidieren und zu einem Gesamtbild zusammenzufügen oder überhaupt die relevanten Daten zu extrahieren und bereitzustellen. An diesem Punkt setzen Augmented Analytics Systeme: Sie ermöglichen es Anwendern auch ohne Data Science Kenntnisse datenbasierte Entscheidungen zu treffen. Augmented Analytics Systeme automatisieren dabei die notwendigen Schritte der Datensammlung, der Bereinigung, und der Visualisierung der Ergebnisse. Zusätzlich bieten Sie Handlungsempfehlungen und können als Basis für automatisierte Geschäftsprozesse dienen.

Nun werfen wir einen Blick auf mögliche Anwendungsfälle und notwendige Schritte auf dem Weg zu Augmented-Analytics-Systemen.

Data Preparation und Analysis

Der erste Schritt besteht darin, User und Datenquellen miteinander zu verbinden – schließlich soll sichergestellt werden, dass so viele relevante Informationen wie möglich genutzt werden können.

Also besteht die erste Hürde darin, die relevanten Datenquellen miteinander zu vernetzen. Es gibt bereits erste Ansätze, um die verfügbaren Datenquellen zu visualisieren, indem man sie zum Beispiel in einer Netzwerkstruktur darstellt. Innerhalb dieser Struktur kann der Benutzer navigieren und Datenquellen auswählen. So lassen sich mithilfe von Algorithmen nicht nur die verschiedenen Datenquellen und -punkte miteinander in Verbindung setzen, sondern auch die Vernetzung untereinander schnell darstellen. Darüber hinaus könnten die Methoden aus dem Bereich Graph Analytics automatisch und intelligent weitere relevante Datengruppen für die bereits ausgewählten Daten vorschlagen und diese zusammenführen. Durch diese Art der Darstellung kann der User die Zusammenhänge zwischen den verschiedenen Informationen schneller begreifen.

Weiteres Merkmal von Augmented Analytics Systemen: Sie besitzen ETL-Funktionen, die bisher zusätzlich genutzt wurden. Mittels Methoden wie Clustering und Regression zur Glättung und Entrauschen lassen sich die Daten im Vorfeld für die Analyse aufbereiten. Algorithmen können zudem Anomalien und Muster in den Unternehmensdaten erkennen. So lassen sich diese Schritte automatisieren, ohne dass hier Anwender aktiv werden müssen bzw. sich Unterstützung mit Data-Science-Hintergrund suchen müssen. So können bereits Verknüpfungen zwischen verschiedenen Daten hergestellt werden.

Ein System, das ohne Data Scientists genutzt werden soll, kann nicht völlig ohne diese entstehen . Data Scientists liefern den Grundstock an Modellen und Features, die im weiteren Verlauf automatisiert vom System über den Nutzer gesteuert werden. Automatisierte Machine Learning Modelle (AutoML) helfen bei der Selektion von Datenquellen, bereinigen diese und visualisieren die Ergebnisse. Sie können außerdem genutzt werden, um Ausreißer zu erkennen und dann während des Lernvorganges ungelabelte Daten (wie Mails, Sensordaten, Social Media Posts etc.) in gelabelte Daten zu transformieren. Das „Lernen“ (Active Learning) des Systems bzw. der Algorithmen erfolgt hier durch das Zurückspielen von Ausreißern an die Nutzer. Anwender können dann in Dashboard, durch geeignete Funktionen, wie dem Result Rating in YUNA, Daten bzw. Analyseergebnisse bewerten. Mit solchen Features lassen sich so Trainingsdatensätze erstellen (z.B. durch das Kategorisieren von Anomalien anhand von Visualisierungen). Diese werden dann automatisch im Augmented Analytics System an die jeweiligen Modelle übermittelt, wobei nun Methoden aus dem Bereich des Supervised Learnings benutzt werden können.

NLP als Basis für Conversational Analytics

Für die angesprochene Verbindung und Auswahl relevanter Informationen kann ebenfalls eine weitere Technologie genutzt werden: Die Verarbeitung von natürlicher Sprache (Natural Language Processing, kurz NLP) z.B. per Suchfeld oder Sprachbefehl. Bei NLP-basierten Bedienelementen können Benutzer ihren Anwendungsfall in Form von ausformulierten Fragen an das System stellen. Basierend auf NLP erkennt das System aus den vom Benutzer gestellten Fragen und angegebenen Informationen, welche Schritte der Datenaufbereitung sowie -analyse für den Anwendungsfall notwendig sind und welche Datenquellen überhaupt relevant sind . Besonders spannend: Mittels eigens trainierter Modelle, kann das System schon bei der Angabe sinnvolle Vorschläge geben. Dabei greifen die NLP-Modelle z.B. unternehmensinterne Bezeichnungen auf und schlagen diese bereits bei der Eingabe vor.

Es gibt bereits BI-Plattformen, die erste Versionen einer NLP-basierten Steuerung von Datenanalysen implementiert haben. Diese beschränken sich derzeit jedoch auf einfache Anfragen. Außerdem erfordern sie meist eine Datenbank, die auf die möglichen Anfragen zugeschnitten ist. Nichtsdestotrotz verspricht dieser Ansatz ein großes Potential und einen hohen Nutzen, indem es fachlich-inhaltliche Fragen des Nutzers in Analyse-Use-Cases und Daten übersetzt.

Ein konkretes Beispiel:

Anwender aus dem Bereich der Beschaffung stellen sich die Frage: „Gibt es einen Zusammenhang zwischen Lieferzeiten verschiedener Anbieter in Abhängigkeit vom Bestellvolumen?“. Im nächsten ersten Schritt werden vom System relevante Informationen vorgeschlagen und angezeigt. In diesem Fall können dies historische Daten aus vergangenen Bestellungen sein bspw. Auftragserstellung, Artikel, Menge und Lieferzeitpunkt. Auf dieser Datengrundlage kann dann ein, von den Anwendern initiiertes Modell, entwickelt werden, dass zu jedem Lieferanten die Lieferzeiten entsprechend der Abhängigkeiten prognostiziert.

Dashboarding / Result Communication

Ein solches System kann nur dann funktionieren, wenn die Benutzeroberfläche intelligent und flexibel gestaltet ist. So müssen Visualisierungen nicht nur automatisch generiert, sondern auch interaktiv sein. Bei der Darstellung kann sich auch nicht nur auf eine Form beschränkt werden. Gibt das System nach der oben genannten Eingabe verschiedene Möglichkeiten zur Visualisierung, vereinfacht dies den Informationstransfer und die Abstraktion ungemein.

Lösungen wie Tableau unterstützen dies, konzentrieren sich aber besonders auf die Flexibilität – Vorschläge für weitergehende Nutzungen oder Handlungen werden selten gegeben.

Ferner müssen Augmented Analytics Dashboard in der Lage sein, anhand der ständigen Nutzung oft gewählte Komponenten vorzuschlagen oder sinnvoll miteinander zu verknüpfen. Auf diese Weise ermöglicht man es den Anwendern alle relevanten Informationen zu erkennen – ohne sich erst ein Dashboard aus einem Baukasten-System zusammenbauen zu müssen. Der nächste logische Schritt ist dann die Steuerung von Geschäftsprozessen. Bei dem beschriebenen Beispiel wäre dies die Auswahl eines geeigneten Lieferanten mit anschließender Auftragserteilung. Auch dieser Schritt ließe sich komplett automatisieren. Die Anwender definieren entsprechende Parameter, wie Lieferzeitpunkt, Menge etc. und das System erteilt den Auftrag.

Einige Teile von Augmented Analytics Systemen, bestehen bereits in verschiedenen Lösungen. Die Herausforderung besteht darin, diese Komponenten zusammenfügen – gerade bei der Entwicklung geeigneter Modelle. Die Erstellung hochwertiger Daten oder die intelligente Auswahl und Konfiguration des Modells sind in einem generalistischen System schwer zu implementieren und müssen bisher an die jeweilige Anwendung angepasst werden. Trivial. Es wäre jedoch denkbar, Augmented-Analytics-Systeme für eine Auswahl von Anwendungsszenarien in einer bestimmten Branche zu entwickeln, die sich die technologische Basis bestehender Lösungen teilen. Je flexibler Plattformen sind, desto geeigneter sind diese für die Entwicklung solcher Systeme. Anwendungen wie YUNA, die darauf konzipiert sind, Machine-Learning-Modelle, ungeachtet des Use Cases, auszuführen und mit Möglichkeiten eigene Dashboards zu entwickeln sind hier natürlich näher am Ziel als starre Out-of-the-Box-Lösungen.