Metadaten-Management ist ein wichtiger Bestandteil eines jeden umfassenderen Datenmanagement-Projekts und erfordert mehr als die bloße Implementierung einer Datenkatalog-Software, egal wie vernetzt diese auch sein mag.
Zwar wird ein solches Tool das Metadaten-Management immer unterstützen, es kann jedoch nicht allein dessen Erfolg garantieren.
Diese Artikelserie ist inspiriert von Erfahrungen aus den unterschiedlichsten Branchen, Unternehmensgrößen und -kulturen und zeigt die wichtigsten Fallstricke und Missverständnisse auf, die Sie bei der Einführung eines unternehmensweiten Datenkatalogs unbedingt vermeiden sollten.
Die beschriebenen Fallstricke drehen sich um vier Themen, die für den Erfolg des Vorhabens von zentraler Bedeutung sind:
- Datenkultur
- Sponsorship
- Projektsteuerung
- Datenkatalog-Integration
—
Die Integration des Datenkatalogs in das Ökosystem des Unternehmens fördert Möglichkeiten zur Wertschöpfung. Es ist von entscheidender Bedeutung, diesen Aspekt sorgfältig zu berücksichtigen und die Vorteile zu verstehen.
Nicht alle Metadaten müssen von Hand eingegeben werden
Immer mehr Systeme produzieren, aggregieren und ermöglichen die Eingabe von Metadaten. Diese Informationen müssen im Katalog abgerufen und konsolidiert werden – ohne Doppelerfassung – aus offensichtlichen Gründen der Wirtschaftlichkeit, Zuverlässigkeit und schnellen Verfügbarkeit.
Der Datenkatalog bietet also die Möglichkeit, diese Informationen mit dem von den Mitarbeitern in ihren jeweiligen Bereichen getragenen Wissen zu konsolidieren. Diese Konsolidierung muss jedoch durch eine technische Integration erfolgen und darf nicht manuell durchgeführt werden. Die Durchführung von Importen/Exporten zwischen Systemen, die auf menschlichen Handlungen beruhen, ist kein sinnvoller Ansatz.
Die Stärke eines Datenkatalogs muss in seiner Fähigkeit liegen, Metadaten über technische Integrationsketten aufzunehmen und so eine robuste Synchronisierung zwischen den Systemen zu ermöglichen. Hier kommt das Konzept der Metadatenplattform zum Tragen.
Der Datenkatalog ist kein „magisches“ Werkzeug
Umgekehrt wäre die Annahme, dass der Datenkatalog alle Arten von Metadaten unabhängig von der Quelle oder dem Format abrufen kann, mehr als irreführend.
Der Katalog soll zwar das Abrufen von Metadaten erleichtern, aber einige Metadaten können nicht automatisch in den Katalog eingefügt werden. Es bleibt also immer ein Kostenfaktor, der durch das Eingreifen von Mitarbeitern getragen wird.
Der erste Grund dafür liegt ganz einfach in der Herkunft einiger Metadaten selbst: Informationen sind vielleicht einfach noch nicht in Systemen vorhanden, weil sie nur aus dem Wissen von Experten stammen. Der Datenkatalog ist in diesem Fall also ein potenzieller Kandidat dafür, das Mastersystem zu werden, um sie aufzunehmen.
Gleichzeitig können manche Informationen aus vielen Gründen in Systemen vorhanden sein, ohne dass es möglich ist, sie automatisiert abzurufen. Beispiele hierfür sind das Fehlen einer Schnittstelle, die einen stabilen Zugriff auf die Informationen ermöglicht, oder die Notwendigkeit, auf Reverse Engineering zurückzugreifen, um relevante Informationen zu isolieren. Das Risiko eines Rauschens in den Informationen ist also hoch, was dazu führen kann, dass die Qualität des Kataloginhalts abnimmt und die Nutzer sich letztendlich von ihm abwenden.
Der Datenkatalog darf nicht mit nur einer einzigen Metadatenquelle verbunden sein
Metadaten existieren auf zahlreichen und unterschiedlichen Ebenen. Die Quellen sind vielfältig und ergänzen sich für ein umfassendes Verständnis. Es ist gerade die Zusammenführung dieser Informationen in einer zentralen Lösung, dem Datenkatalog, die den Nutzern die Elemente liefern wird, die sie für ihre Zwecke benötigen.
Die Wahl eines vernetzten Datenkatalogs ist ein echter Vorteil, da das Auffinden von Assets und das Abrufen der zugehörigen Metadaten durch Automatisierung erheblich vereinfacht wird.
Diese Konnektivität kann sich aber sehr oft auch auf andere, komplementäre Systeme erstrecken. Dabei handelt es sich um andere Systeme, die dem ersten System vor- oder nachgelagert sind und es ermöglichen, Data Lineage zu materialisieren und so den Fluss und die Transformationen zwischen den Systemen zu dokumentieren.
Die Systeme müssen jedoch nicht miteinander verbunden sein und können lediglich dazu beitragen, dass durch ihre Hinzufügung zum Datenkatalog eine umfassende Kartografie der Unternehmensdaten erstellt wird.
Schließlich können die verschiedenen angeschlossenen Quellen aufgrund der Vielfalt der Daten, die im Datenkatalog dokumentiert werden können, auch jede für sich zur Anreicherung einer bestimmten Ebene im Datenkatalog beitragen: semantische Schicht für die einen, physische Schicht für die anderen etc.
Die verschiedenen Quellen, die in den Datenkatalog einfließen, werden nach und nach unter der Gesamtleitung des Data Offices integriert, wobei die Strategie von der Wertschöpfung geprägt ist.
Die 10 Fallstricke bei der Implementierung eines Datenkatalogs
Wenn Sie mehr über die für ein erfolgreiches Datenkatalog-Projekt zu vermeidende Fallstricke erfahren möchten, laden Sie sich unser kostenloses eBook herunter!