Abstract Graphic World Map Illustration On Blue Background, Big Data And Networking Concept 3d Rendering

Die Fallstricke bei der Implementierung eines Datenkatalogs – Datenkatalog-Integration

September 29, 2022
September 29, 2022
29 September 2022

Metadaten-Management ist ein wichtiger Bestandteil eines jeden umfassenderen Datenmanagement-Projekts und erfordert mehr als die bloße Implementierung einer Datenkatalog-Software, egal wie vernetzt diese auch sein mag.

Zwar wird ein solches Tool das Metadaten-Management immer unterstützen, es kann jedoch nicht allein dessen Erfolg garantieren.

Diese Artikelserie ist inspiriert von Erfahrungen aus den unterschiedlichsten Branchen, Unternehmensgrößen und -kulturen und zeigt die wichtigsten Fallstricke und Missverständnisse auf, die Sie bei der Einführung eines unternehmensweiten Datenkatalogs unbedingt vermeiden sollten.

Die beschriebenen Fallstricke drehen sich um vier Themen, die für den Erfolg des Vorhabens von zentraler Bedeutung sind:

  1. Datenkultur
  2. Sponsorship
  3. Projektsteuerung
  4. Datenkatalog-Integration

Die Integration des Datenkatalogs in das Ökosystem des Unternehmens fördert Möglichkeiten zur Wertschöpfung. Es ist von entscheidender Bedeutung, diesen Aspekt sorgfältig zu berücksichtigen und die Vorteile zu verstehen.

Nicht alle Metadaten müssen von Hand eingegeben werden

Immer mehr Systeme produzieren, aggregieren und ermöglichen die Eingabe von Metadaten. Diese Informationen müssen im Katalog abgerufen und konsolidiert werden – ohne Doppelerfassung – aus offensichtlichen Gründen der Wirtschaftlichkeit, Zuverlässigkeit und schnellen Verfügbarkeit.

Der Datenkatalog bietet also die Möglichkeit, diese Informationen mit dem von den Mitarbeitern in ihren jeweiligen Bereichen getragenen Wissen zu konsolidieren. Diese Konsolidierung muss jedoch durch eine technische Integration erfolgen und darf nicht manuell durchgeführt werden. Die Durchführung von Importen/Exporten zwischen Systemen, die auf menschlichen Handlungen beruhen, ist kein sinnvoller Ansatz.

Die Stärke eines Datenkatalogs muss in seiner Fähigkeit liegen, Metadaten über technische Integrationsketten aufzunehmen und so eine robuste Synchronisierung zwischen den Systemen zu ermöglichen. Hier kommt das Konzept der Metadatenplattform zum Tragen.

Der Datenkatalog ist kein „magisches“ Werkzeug

Umgekehrt wäre die Annahme, dass der Datenkatalog alle Arten von Metadaten unabhängig von der Quelle oder dem Format abrufen kann, mehr als irreführend.

Der Katalog soll zwar das Abrufen von Metadaten erleichtern, aber einige Metadaten können nicht automatisch in den Katalog eingefügt werden. Es bleibt also immer ein Kostenfaktor, der durch das Eingreifen von Mitarbeitern getragen wird.

Der erste Grund dafür liegt ganz einfach in der Herkunft einiger Metadaten selbst: Informationen sind vielleicht einfach noch nicht in Systemen vorhanden, weil sie nur aus dem Wissen von Experten stammen. Der Datenkatalog ist in diesem Fall also ein potenzieller Kandidat dafür, das Mastersystem zu werden, um sie aufzunehmen.

Gleichzeitig können manche Informationen aus vielen Gründen in Systemen vorhanden sein, ohne dass es möglich ist, sie automatisiert abzurufen. Beispiele hierfür sind das Fehlen einer Schnittstelle, die einen stabilen Zugriff auf die Informationen ermöglicht, oder die Notwendigkeit, auf Reverse Engineering zurückzugreifen, um relevante Informationen zu isolieren. Das Risiko eines Rauschens in den Informationen ist also hoch, was dazu führen kann, dass die Qualität des Kataloginhalts abnimmt und die Nutzer sich letztendlich von ihm abwenden.

Der Datenkatalog darf nicht mit nur einer einzigen Metadatenquelle verbunden sein

Metadaten existieren auf zahlreichen und unterschiedlichen Ebenen. Die Quellen sind vielfältig und ergänzen sich für ein umfassendes Verständnis. Es ist gerade die Zusammenführung dieser Informationen in einer zentralen Lösung, dem Datenkatalog, die den Nutzern die Elemente liefern wird, die sie für ihre Zwecke benötigen.

Die Wahl eines vernetzten Datenkatalogs ist ein echter Vorteil, da das Auffinden von Assets und das Abrufen der zugehörigen Metadaten durch Automatisierung erheblich vereinfacht wird.

Diese Konnektivität kann sich aber sehr oft auch auf andere, komplementäre Systeme erstrecken. Dabei handelt es sich um andere Systeme, die dem ersten System vor- oder nachgelagert sind und es ermöglichen, Data Lineage zu materialisieren und so den Fluss und die Transformationen zwischen den Systemen zu dokumentieren.

Die Systeme müssen jedoch nicht miteinander verbunden sein und können lediglich dazu beitragen, dass durch ihre Hinzufügung zum Datenkatalog eine umfassende Kartografie der Unternehmensdaten erstellt wird.

Schließlich können die verschiedenen angeschlossenen Quellen aufgrund der Vielfalt der Daten, die im Datenkatalog dokumentiert werden können, auch jede für sich zur Anreicherung einer bestimmten Ebene im Datenkatalog beitragen: semantische Schicht für die einen, physische Schicht für die anderen etc.

Die verschiedenen Quellen, die in den Datenkatalog einfließen, werden nach und nach unter der Gesamtleitung des Data Offices integriert, wobei die Strategie von der Wertschöpfung geprägt ist.

Die 10 Fallstricke bei der Implementierung eines Datenkatalogs

Wenn Sie mehr über die für ein erfolgreiches Datenkatalog-Projekt zu vermeidende Fallstricke erfahren möchten, laden Sie sich unser kostenloses eBook herunter!

Die 10 Fallstricke Bei Der Implementierung Eines Datenkatalogs Mockup

zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

zeenea logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

Related posts

Articles similaires

Ähnliche Artikel

Be(come) data fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

Werden Sie Data Fluent

Entdecken Sie die neuesten Trends rund um die Themen Big Data, Datenmanagement, Data Governance und vieles mehr im Zeenea-Blog.

Melden Sie sich zu unserem Newsletter an und werden Sie Teil unserer Community!

Let's get started
Make data meaningful & discoverable for your teams
Learn more >

Los geht’s!

Geben Sie Ihren Daten einen Sinn

Mehr erfahren >

Soc 2 Type 2
Iso 27001
© 2024 Zeenea - All Rights Reserved
Soc 2 Type 2
Iso 27001
© 2024 Zeenea - All Rights Reserved
Démarrez maintenant
Donnez du sens à votre patrimoine de données
En savoir plus
Soc 2 Type 2
Iso 27001
© 2024 Zeenea - Tous droits réservés.