Kategorie

Kontakt

Was ist Federated Learning? Dezentrales Machine Learning für datensensible Unternehmen

Was ist Federated Learning?

Federated Learning ist ein Ansatz im Machine Learning, bei dem ein Modell dezentral trainiert wird – direkt auf den Geräten oder Systemen, auf denen die Daten liegen. Statt alle Daten an einen zentralen Server zu senden, bleiben sie dort, wo sie entstehen. Nur die Modell-Updates (Gradienten) werden aggregiert, um das Gesamtmodell zu verbessern.

Für Schweizer Unternehmen, die mit sensiblen Produktions-, Patienten- oder Bürgerdaten arbeiten, bietet Federated Learning einen entscheidenden Vorteil: KI nutzen, ohne Datenschutz zu kompromittieren.

Wie funktioniert Federated Learning?

Der Prozess folgt einem iterativen Zyklus:

  1. Initiales Modell – Ein zentraler Server stellt ein Basis-Modell bereit und verteilt es an die Teilnehmer (Geräte, Standorte, Organisationen).
  2. Lokales Training – Jeder Teilnehmer trainiert das Modell auf seinen eigenen Daten. Die Rohdaten verlassen das lokale System nie.
  3. Update-Aggregation – Die Teilnehmer senden nur die Modell-Updates an den Server. Dieser aggregiert sie (z. B. per Federated Averaging) zu einem verbesserten Gesamtmodell.
  4. Iteration – Der Zyklus wiederholt sich, bis das Modell die gewünschte Genauigkeit erreicht.

Der zentrale Unterschied zu klassischem Machine Learning: Die Daten bleiben verteilt. Das ist besonders relevant, wenn Unternehmen eine Datenstrategie entwickeln, die Datenschutz und KI-Nutzung in Einklang bringen muss.

Warum ist Federated Learning relevant für Schweizer Unternehmen?

Das neue Datenschutzgesetz (revDSG) und branchenspezifische Regularien stellen hohe Anforderungen an den Umgang mit sensiblen Daten. Gleichzeitig wächst der Druck, Künstliche Intelligenz produktiv einzusetzen. Federated Learning löst diesen Zielkonflikt:

  • Datenschutz by Design – Rohdaten bleiben lokal, nur Modell-Parameter werden geteilt.
  • Regulatorische Compliance – Ideal für Branchen mit strengen Datenschutzanforderungen (Gesundheitswesen, öffentliche Verwaltung, Finanzsektor).
  • Nutzung verteilter Datenquellen – Datensilos werden produktiv genutzt, ohne sie physisch zusammenzuführen.
  • Skalierbarkeit – Neue Teilnehmer können hinzukommen, ohne die bestehende Data Pipeline umzubauen.

Federated Learning in der Praxis: Drei Szenarien

Szenario 1: Predictive Maintenance über mehrere Produktionsstandorte

Ein Industrieunternehmen betreibt Fertigungsanlagen an mehreren Standorten. Sensordaten zu Vibration, Temperatur und Druck fallen lokal an – und dürfen aus Sicherheitsgründen das Werk nicht verlassen. Mit Federated Learning trainiert jeder Standort ein lokales Predictive-Maintenance-Modell, das Ausfälle vorhersagt. Die Modell-Updates werden zentral aggregiert, sodass alle Werke von den Erkenntnissen der anderen profitieren – ohne Rohdaten auszutauschen. Die Basis dafür: eine durchdachte industrielle Datenarchitektur.

Szenario 2: Flottenweite Verschleissprognose im öffentlichen Verkehr

Verkehrsunternehmen sammeln Sensordaten aus Trams, Bussen und Schieneninfrastruktur. Diese Daten liegen auf Edge-Geräten in den Fahrzeugen und dürfen nicht ohne Weiteres in die Cloud übertragen werden. Federated Learning ermöglicht es, Verschleissmodelle lokal zu trainieren und die Erkenntnisse flottenübergreifend zu nutzen – ohne zentrale Datenhaltung. Voraussetzung ist eine skalierbare Data-Lake-Architektur, die sowohl Edge- als auch Cloud-Daten orchestriert.

Szenario 3: Organisationsübergreifende Modelle in der öffentlichen Verwaltung

Kantone und Gemeinden verfügen über wertvolle Daten zu Bevölkerung, Verkehr und Infrastruktur – dürfen diese aber nicht einfach zusammenführen. Mit Federated Learning könnten mehrere Verwaltungseinheiten gemeinsam ein Modell trainieren (z. B. für Bedarfsprognosen im Sozialwesen), ohne personenbezogene Daten auszutauschen. Das unterstützt sowohl die Data Governance als auch Open-Government-Initiativen.

In allen drei Szenarien gilt: Eine solide Datenlandkarte und Datenmaturitätsanalyse sind Voraussetzungen, um zu verstehen, welche Daten wo liegen und wie sie für dezentrales Training genutzt werden können.

Federated Learning vs. klassisches Machine Learning

Der Hauptunterschied liegt in der Datenhaltung:

  • Klassisches ML – Alle Daten werden an einem zentralen Ort (z. B. einem Data Warehouse) gesammelt und das Modell wird zentral trainiert.
  • Federated Learning – Die Daten bleiben verteilt. Das Modell kommt zu den Daten, nicht umgekehrt.

Beide Ansätze haben ihre Berechtigung. Für viele Use Cases – etwa wenn Datenschutz kein limitierender Faktor ist – bleibt zentrales Training effizienter. Federated Learning entfaltet seinen Wert dort, wo Daten nicht zentralisiert werden können oder dürfen.

Herausforderungen von Federated Learning

Federated Learning ist kein Selbstläufer. Die wichtigsten Herausforderungen:

  • Heterogene Datenqualität – Unterschiedliche Standorte liefern Daten in unterschiedlicher Qualität und Verteilung (Non-IID-Daten). Das erschwert die Modellkonvergenz.
  • Kommunikationsaufwand – Der Austausch von Modell-Updates zwischen Teilnehmern und Server braucht Bandbreite und eine robuste Infrastruktur.
  • Sicherheit – Obwohl keine Rohdaten übertragen werden, können Modell-Updates theoretisch Rückschlüsse auf die Trainingsdaten erlauben (Model Inversion Attacks). Differential Privacy und Secure Aggregation sind Gegenmassnahmen.
  • Infrastrukturanforderungen – Teilnehmergeräte brauchen genug Rechenleistung für lokales Training. Das setzt eine durchdachte Data-Application-Architektur voraus.

Wann lohnt sich Federated Learning?

Federated Learning ist der richtige Ansatz, wenn:

  • Sensible oder regulierte Daten verarbeitet werden (Gesundheit, Finanzen, öffentliche Verwaltung)
  • Daten physisch verteilt sind und nicht zentralisiert werden können (Multi-Standort-Industrie, Fahrzeugflotten)
  • Mehrere Organisationen gemeinsam ein Modell trainieren möchten, ohne Daten zu teilen
  • Datenschutzanforderungen wie das revDSG oder branchenspezifische Regularien gelten

Wenn diese Bedingungen zutreffen, ist Federated Learning ein strategischer Enabler für KI-Projekte. Voraussetzung ist ein MLOps-Framework, das den dezentralen Trainingsprozess orchestriert.

Nächste Schritte: Vom Konzept zum KI-Projekt

Ob Federated Learning, klassisches ML oder RAG-basierte Ansätze – der richtige Weg hängt von Ihren Daten, Ihrer Infrastruktur und Ihren regulatorischen Rahmenbedingungen ab. Substring begleitet Schweizer Unternehmen von der strategischen Datenberatung über den Aufbau einer Datenplattform bis zur produktiven KI-Lösung.

Sie möchten herausfinden, ob Federated Learning für Ihren Use Case in Frage kommt? Oder stehen Sie vor der Frage, wie Sie Ihre Daten KI-ready machen – ohne Datenschutz zu kompromittieren?

Jetzt unverbindlich Erstgespräch vereinbaren

kontakt

Wir freuen uns, von Ihnen zu hören!