Zeenea - Data Innovation Summit 2022

Leitfaden zum Data Quality Management #4 – Der Beitrag des Datenkatalogs zum DQM

April 4, 2022
April 4, 2022
04 April 2022

Datenqualität, besser bekannt unter dem englischen Begriff Data Quality, bezieht sich auf die Fähigkeit eines Unternehmens, seine Daten dauerhaft und im Laufe der Zeit zu erhalten. Zum Thema Datenqualität hört man von Fachleuten immer wieder, dass deren Verbesserung die Lösung für alle geschäftlichen Probleme ist und daher oberste Priorität haben sollte.

Die Realität sieht unserer Meinung nach jedoch anders aus: Datenqualität sollte nur als ein Mittel unter vielen betrachtet werden, um die Unsicherheit beim Erreichen der Unternehmensziele zu verringern.

In dieser Serie erfahren Sie alles, was Sie über Datenqualitätsmanagement (DQM) wissen müssen:

  1. Die neun Dimensionen der Datenqualität
  2. Die Herausforderungen und Risiken der Datenqualität
  3. Die wichtigsten Funktionen eines DQM-Tools
  4. Der Beitrag des Datenkatalogs zum DQM

 

Ein Datenkatalog ist kein DQM-Tool

Ein Datenkatalog sollte nicht als vollwertiges QM-Werkzeug betrachtet werden, so wie wir es in diesem Artikel beschrieben haben.

Zunächst einmal ist eines der Kernprinzipien der Datenqualität, dass die Kontrollen idealerweise direkt im Quellsystem stattfinden sollten. Wenn diese Prüfungen nur im Datenkatalog – und nicht direkt an der Quelle und in den Transformation-Pipelines – durchgeführt werden, erhöht dies die Gesamtkosten.

Zweitens muss ein Datenkatalog so umfassend und so wenig intrusiv wie möglich sein, um eine schnelle Einführung im Unternehmen zu gewährleisten. Dies ist nicht vereinbar mit der Komplexität der Datentransformationen und der Vielzahl an Werkzeugen, die zur Durchführung dieser Transformationen verwendet werden. 

Letztlich muss ein Datenkatalog ein einfach zu verstehendes und benutzerfreundliches Tool bleiben, wie in Artikel 3 unserer Data Democracy beschrieben.

Der Beitrag des Datenkatalogs zum DQM

Der Datenkatalog ist zwar kein DQM-Tool, trägt aber dennoch wesentlich dazu bei, und zwar auf folgende Art und Weise:

  • Mithilfe des Datenkatalogs können Datennutzer Metadaten leicht verstehen, um Interpretationen der Daten zu vermeiden. Bezogen auf DQM spiegelt diese grundlegende Funktion die Dimension der Klarheit wider;

  • Ein Datenkatalog ermöglicht eine zentrale Sicht auf alle im Unternehmen verfügbaren Daten. Informationen zur Datenqualität sind also Metadaten wie alle anderen auch, die den Benutzern zur Verfügung gestellt werden müssen. Sie sollten leicht zu interpretieren und abrufbar sein und die Dimensionen Genauigkeit, Konsistenz, Validität, Einzigartigkeit, Vollständigkeit und Aktualität widerspiegeln.
  • Ein Datenkatalog hat die Funktion, Daten zurückzuverfolgen (Data Lineage), was der Dimension der Nachvollziehbarkeit entspricht;

  • Ein Datenkatalog ermöglicht in der Regel den direkten Zugriff auf die Datenquelle, was die Dimension der Verfügbarkeit widerspiegelt.

Die Strategie zur Implementierung von DQM

Die folgende Tabelle zeigt im Detail, wie Datenqualität in den verschiedenen auf dem Markt existierenden Lösungen berücksichtigt wird:

data-quality-data-catalog

Wie bereits beschrieben, sollten standardmäßig so viele Qualitätstests und -überprüfungen wie möglich direkt im Quellsystem durchgeführt werden. Die Integration von Qualitätstests in einen Data Catalog kann zwar die Benutzererfahrung verbessern, ist aber aufgrund seiner Beschränkungen – die Data Quality ist nicht in die Transformationen integriert – nicht unbedingt erforderlich. 

Wenn die Systeme jedoch komplexer werden und man beispielsweise die Daten mehrerer uneinheitlicher Systeme, die nicht die gleichen funktionalen Regeln implementiert haben, konsolidieren möchte, wird ein spezialisiertes Data-Quality-Tool unerlässlich.

Die Implementierungsstrategie wird von den Use Cases und den Zielen des Unternehmens abhängen. Grundsätzlich ist es jedoch sinnvoll, DQM inkrementell einzuführen:

  1. Sicherstellen, dass das Quellsystem die relevanten Qualitätsregeln beinhaltet;
  2. Einen Datenkatalog einführen, um die Qualität in Bezug auf die Dimensionen Genauigkeit, Nachvollziehbarkeit und/ oder Verfügbarkeit zu verbessern;
  3. Data Quality mit einem spezialisierten Tool in die Datentransformationen integrieren und gleichzeitig diese Informationen über API automatisch in den Data Catalog zurückführen.

 

Fazit

Datenqualität bezieht sich auf die Fähigkeit eines Unternehmens, seine Daten dauerhaft und im Laufe der Zeit zu erhalten. Bei Zeenea definieren wir sie anhand von neun der sechzig Dimensionen, die DAMA International identifiziert hat: Vollständigkeit, Genauigkeit, Validität, Einzigartigkeit, Konsistenz, Aktualität, Nachvollziehbarkeit, Klarheit und Verfügbarkeit erfüllen.

Als Data-Catalog-Anbieter lehnen wir die Vorstellung ab, dass der Datenkatalog ein vollwertiges QM-Instrument ist. Es handelt sich lediglich um eine von mehreren Möglichkeiten, zur Verbesserung der Datenqualität beizutragen – insbesondere in den Dimensionen Klarheit, Verfügbarkeit und Rückverfolgbarkeit

 

    Werfen Sie einen Blick in unseren Leitfaden zum Data Quality Management

    Für weitere Informationen über Datenqualität und DQM, laden Sie sich jetzt unseren kostenlosen “Leitfaden zum Data Quality Management“ herunter!

    der-leitfaden-zum-data-quality-management-cover

    zeenea logo

    At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

    zeenea logo

    Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

    zeenea logo

    Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

    Related posts

    Articles similaires

    Ähnliche Artikel

    Be(come) data fluent

    Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

    Join our community by signing up to our newsletter!

    Devenez Data Fluent

    Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

    Rejoignez notre communauté en vous inscrivant à notre newsletter !

    Werden Sie Data Fluent

    Entdecken Sie die neuesten Trends rund um die Themen Big Data, Datenmanagement, Data Governance und vieles mehr im Zeenea-Blog.

    Melden Sie sich zu unserem Newsletter an und werden Sie Teil unserer Community!

    Let's get started
    Make data meaningful & discoverable for your teams
    Learn more >

    Los Geht’s!

    Geben Sie Ihren Daten einen Sinn

    Mehr erfahren >

    Démarrez maintenant
    Donnez du sens à votre patrimoine de données
    En savoir plus >