Was ist Federated Learning? Hintergründe und Anwendungsbeispiele

Viel hilft viel: Dieses Prinzip gilt nicht immer. Bei der Entwicklung von Machine-Learning-Modellen hingegen schon. Qualität und Güte von Algorithmen sind untrennbar mit der verfügbaren Datenmenge verbunden. Genau dies ist eine der größten Hürden bei der Umsetzung von Data-Science-Projekten und dem erfolgreichen Einsatz von Künstlicher Intelligenz. Viele Unternehmen verfügen nur über begrenzte Datenmengen und selbst diese liegen zum Teil in abgeschlossenen Silos, die nur einzelnen Abteilungen zur Verfügung stehen. Die Themen Datenhoheit und Datenschutz sind die regulatorische Basis der Datenverarbeitung, aber gleichzeitig auch Bremsklotz für das schnelle und umfangreiche Training von Analysemodellen.

Federated Learning: Paradigmenwechsel – Zusammenführen von Modellen, nicht von Daten

Ein Lösungsansatz für dieses Problem: Federated Learning – das föderale Lernen. Federated Learning ist eine spezielle Technik des verteilten maschinellen Lernens, die es ermöglicht, die Modellgüte entscheidend zu verbessern und gleichzeitig die Datenschutzbestimmungen einzuhalten. Wie dies gelingt? Beim Federated Learning wird aus einer Vielzahl einzelner Analysemodelle unterschiedlicher Teilnehmer ein zentrales Modell gebildet. Dieses nimmt wiederum iterativ Einfluss auf die Einzelmodelle.

Das Erfolgsrezept? Die Möglichkeit, eine deutlich umfangreichere Datenbasis für das Training der Modelle einzubeziehen – dezentral und ohne Herausgabe sensibler Informationen. Die Daten verbleiben jederzeit bei den Besitzern. Das zentrale Analysemodell erhält nur die Lernergebnisse, die Parameter, der einzelnen Modelle.

Das Entscheidende: Der entstehende Lerneffekt wird durch die Einbeziehung der Informationen aus dem Training unterschiedlicher Daten massiv verstärkt. Mehrere Modelle werden parallel trainiert und die Genauigkeit der einzelnen Modelle steigt.

Federated Learning: Die entstehenden Vorteile für Unternehmen

Für Unternehmen mit sehr begrenzter Datenbasis kann Federated Learning der Türöffner im Hinblick auf die Entwicklung datengetriebener Prozesse und Services sein. In Use Cases, in denen es um die Analyse von Rare Events geht oder besondere Datenschutzbestimmungen bestehen, kann Federated Learning helfen, deutlich schneller zu einer hohen Modellgüte und belastbaren Ergebnissen zu kommen. Federated Learning hat also das Potenzial, die Time-to-Market von KI-Lösungen entscheidend zu reduzieren, dadurch Kosten einzusparen und schneller Mehrwerte zu generieren.

Use Cases von Federated Learning

  • Industrie & Maschinenbau: Predictive Maintenance ist einer der zentralen Data-Science-Use-Cases in der Industrie. Maschinenausfälle sind dabei häufig sehr seltene Ereignisse mit heterogenem Ursprung. Gerade dieser Kontext ist ein prägnantes Beispiel für die Datenhoheit als Herausforderung. Maschinenbauer oder -betreiber: Wer hat die Hoheit über die Daten und wie können Wege gefunden werden, sodass beide Parteien von den Maschineninformationen profitieren können? Denn: In Ermangelung an einer ausreichenden Menge an Trainingsdaten sind präzise Prognosen von Maschinenausfällen in vielen Fällen nicht möglich. Federated Learning kann hier die Lösung sein und das Volumen an Trainingsdaten und damit verbunden auch die Informationen über Maschinenausfälle deutlich erweitern. So gelingt es den beteiligten Unternehmen Wissensvorsprünge für die proaktive Maschineninstandhaltung zu erzielen, die ihnen als Einzelkämpfer verwehrt geblieben wären.

  • Gesundheitswesen: Besonders im Gesundheitswesen sind aussagekräftige und umfangreiche Datensätze aufgrund der Sensibilität der Patienteninformationen schwer zu bekommen. Ein konkretes Beispiel kann hier die Bildverarbeitung von MRT-Aufnahmen zur Tumorerkennung sein. Medizinische Institutionen sind angewiesen auf ihre eigenen Datenbestände, welche aber durch demografische Besonderheiten verzerrt sein können. Federated Learning kann helfen, Erfahrungen aus einer breiten Datenbasis zu sammeln ohne dabei sensible klinische Daten teilen zu müssen. Mittels Differential Privacy kann bei personenbezogenen Daten zusätzlich die Anonymisierung erhöht werden. Hierbei wird ein Rauschen über die Parameterschätzung gelegt um Rückschlüsse auf Einzelpersonen zu verhindern. Ein technologischer Vorreiter im Gesundheitswesen ist unser Partner NVIDIA, der mit seinem Healthcare-Framework zur Bildverarbeitung und Genomforschung – NVIDIA Clara – Federated Learning Ansätze realisiert.

 

  • Unterhaltungselektronik: Ein typisches Einsatzgebiet für Federated Learning ist die Optimierung von Technologieprodukten im Consumer Bereich. Smartphone-Nutzer haben ein Interesse an der kontinuierlichen Verbesserung ihrer eingesetzten Anwendungen, aber natürlich nicht an der direkten Weitergabe ihrer individuellen Nutzungsdaten. Mit Federated Learning können zum Beispiel die Parameter aus der Analyse der Tastatureingaben von Millionen Nutzern zur Optimierung der Autovervollständigung genutzt werden – ohne, dass persönliche Daten dafür das Smartphone verlassen müssen.

 

  • Landwirtschaft: Die Minimierung des Düngemitteleinsatzes, das Monitoring des Pflanzenzustands oder die Steigerung der Prozesseffizienz – Ideen für den Einsatz von Data Science in der Landwirtschaft gibt es viele. Mit Federated Learning können alle landwirtschaftlichen Akteure von datenbasierten Geschäftsmodellen profitieren, ohne dass sie ihre wertvollen Daten dafür preisgeben müssen. Agrarmaschinenhersteller erhalten wertvolle Informationen für die Weiterentwicklung ihrer Maschinen und die Schaffung digitaler Services. Digitalisierte Landwirte profitieren von belastbaren Informationen, die ihnen wirklich helfen können, ihre Arbeit ertragreicher zu gestalten.

 

 

Der Einsatz von Federated Learning: Erste Lösungen bereits vorhanden

Neben der zuvor bereits erwähnten Lösung von NVIDIA gibt es weitere Frameworks für Federated Learning. Als Beispiele seien hier TensorFlow Federated oder PySyft genannt. In einem weiteren Artikel erklären wir Ihnen demnächst mehr zur technischen Umsetzung von Federated Learning.

Die Entwicklungen werden hier schnell voranschreiten, denn im Thema Federated Learning steckt enormes Potenzial. Dafür braucht es natürlich neben dem Umgang mit technischen Herausforderungen wie der Lastenverteilung und der Modellsicherheit vor allem die Bereitschaft von Unternehmen zur Zusammenarbeit. Federated Learning ist also auch eine Frage des Mindsets. Wenn Unternehmen aber die natürlichen Grenzen des Alleingangs in puncto KI und Co. erkennen, kann Federated Learning und die Kollaboration sehr attraktiv werden.

Als Data Science Experten beraten wir Sie sehr gerne rund um das Thema Federated Learning und entwickeln gemeinsam mit Ihnen ein Konzept, wie Ihr Unternehmen von Federated Learning profitieren kann. Wie? In unserem Workshop zum Thema Federated Learning.

Erfahren Sie mehr. 

Ihr Ansprechpartner zu diesem Thema:
Oliver Bracht

Kontakt aufnehmen
bild-oliver-bracht

Tobias Titze - Beitrag vom 06.05.2020

Tobias Titze betreut seit 2013 das Marketing der eoda GmbH. Seine tägliche Aufgabe ist der Brückenschlag zwischen einem komplexen Thema und den Anforderungen des Marktes. Er interessiert sich für Daten und Algorithmen und begeistert sich für die Vorteile, die sich für Unternehmen daraus ergeben.

Abonnieren Sie unseren Datenanalyse-Blog