Jahrelang standen Unternehmen vor der Herausforderung, Daten zu sammeln. Nun besteht die eigentliche Herausforderung darin, eine schwer zu kontrollierende Datenfülle mithilfe von Insights zu durchdringen. Zahlreiche Technologien und Lösungen versprechen eine optimale Verarbeitung und Verwertung Ihrer Daten. Dazu gehören unter anderem die Data Fabric und das Data Mesh. Auch wenn diese Konzepte ähnlich erscheinen mögen, gibt es grundlegende Unterschiede zwischen den beiden Ansätzen. Einige Erklärungen.
Kundenkenntnis ist eine Voraussetzung, um sich in einem besonders wettbewerbsintensiven Umfeld zu differenzieren, digitale Wege und Nutzungsszenarien entwickeln sich, und die Datenmengen, die Ihrem Unternehmen zur Verfügung stehen, explodieren förmlich! Doch die Fülle an Informationen ist ohne Insights und differenzierte Auswertung nichts wert. Diese Tatsache beeinflusst das gesamte Datenökosystem.
Wenn man die Prognosen von Gartner zugrunde legt, werden bis 2024 mehr als 25 % der Anbieter von Datenmanagement-Lösungen eine umfassende Unterstützung der Datenstruktur bieten, und zwar durch eine Kombination ihrer eigenen Produkte und der Produkte von Partnern. Im Vergleich: Heute tun dies weniger als 5 %.
In diesem Zusammenhang können mehrere Wege beschritten werden, aber zwei Wege stechen aus der Masse hervor: Data Fabric und Data Mesh.
Was ist eine Data Fabric?
Das Konzept der Data Fabric wurde von Gartner im Jahr 2019 eingeführt. Das renommierte Institut beschreibt eine Data Fabric als die kombinierte Nutzung mehrerer bestehender Technologien, um eine metadatenbasierte Implementierung und ein erweitertes Design von Orchestrierungen zu ermöglichen.
Anders ausgedrückt: Die Data Fabric stellt eine Umgebung dar, in der Daten und Metadaten kontinuierlich analysiert werden, um sie fortlaufend anzureichern und optimal zu nutzen. Es ist aber Vorsicht geboten! Eine Data Fabric ist kein fertiges Produkt oder gar eine fertige Lösung. Sie ist eine Umgebung, die zusammengesetzt werden kann, und die auf der Kombination verschiedener Lösungen oder Anwendungen basiert, die miteinander interagieren, um die Daten aufzuarbeiten.
Die Data Fabric stützt sich auf APIs und eine No-Code-Plattform, die Synergien zwischen verschiedenen Anwendungen und Diensten schafft, mit deren Hilfe Daten umgewandelt werden können, um über ihren gesamten Lebenszyklus hinweg die wirklich zentralen Informationen aus ihnen zu extrahieren. Schematisch betrachtet kann die Data Fabric mit einer Raffinerie und ihren vielen verschiedenen Rohrverbindungen verglichen werden.
Was ist ein Data Mesh?
Zhamak Dehghani von Thoughtworks gilt als Urheber des Konzepts des Data Mesh. Bereits Ende 2018 wurde die Definition festgelegt. Das Prinzip? Ein neuer Ansatz für die Datenarchitektur und eine neue Art der Organisation, die auf der Vernetzung von Daten beruht. Das Data Mesh basiert auf der Erstellung einer Datenstruktur mit mehreren Bereichen. Die Daten werden katalogisiert, identifiziert und nach ihrer Verwendung, ihrem Ziel oder ihrer möglichen Nutzung neu organisiert.
Das Data Mesh stützt sich auf einige grundlegende Prinzipien: den Data Owner, den Data Self-Service und die Interoperabilität. Diese drei Prinzipien ermöglichen eine dezentralisierte Datenverwaltung. Welche Vorteile bietet das? Interaktionen zwischen verschiedenen Bereichen mit unterschiedlichen Daten entstehen lassen, um immer mehr Insights zu erzeugen.
Die wichtigsten Unterschiede zwischen einer Data Fabric und einem Data Mesh
Um die Unterschiede zwischen Data Fabric und Data Mesh zu verstehen, wollen wir zunächst ihre Gemeinsamkeiten betrachten. In beiden Fällen gibt es keine „schlüsselfertige“ Lösung.
Während die Data Fabric auf einem flexiblen Ökosystem von Softwarelösungen zur Datennutzung beruht, ist das Data Mesh eine spezielle Art der Datenorganisation. Bei einem Data Mesh werden die Daten dezentral in ihrem jeweiligen Bereich innerhalb eines Unternehmens gespeichert. Jeder Knoten verfügt über einen lokalen Speicher und eigene Rechenleistung, und für den Betrieb ist kein zentraler Kontrollpunkt erforderlich.
Bei einer Data Fabric hingegen wird der Datenzugriff zentralisiert, mit Clustern von Hochgeschwindigkeitsservern für das Netzwerk und die gemeinsame Nutzung leistungsstarker Ressourcen. Auf der Ebene der Datenarchitektur gibt es ebenfalls Unterschiede. So führt das Data Mesh eine organisatorische Perspektive ein, die unabhängig von spezifischen Technologien ist. Seine Architektur folgt einem domänenorientierten Design und einem produktbezogenem Denken.
Data Mesh und Data Fabric folgen zwar unterschiedlichen Logiken, dienen aber dem gleichen Ziel: der optimalen Nutzung Ihrer Datenbestände. Daher sollte man sie trotz ihrer Unterschiede keinesfalls gegeneinander aufwiegen, sondern sie vielmehr als komplementär betrachten.