Unabhängig von der Branche ist das Beherrschen der Daten ein strategischer Schlüsselbereich für jedes Unternehmen.Diese Informationen sind entscheidend, um Innovationen für die Produkte und Dienstleistungen von morgen zu entwickeln. Mit dem Aufkommen neuer Technologien wie Big Data, IoT oder auch künstlicher Intelligenz sammeln Unternehmen zudem exponentiell wachsende Datenmengen, die aus verschiedenen Quellen mit unterschiedlichen Formaten stammen.
Darüber hinaus erfordert die Datenverarbeitung aufgrund der immer strengeren Vorschriften wie der DSGVO die Einführung geeigneter Sicherheitsmaßnahmen, um Datenlecks und missbräuchlicher Verarbeitung vorzubeugen.
Die Herausforderung liegt also in der erneuten Inbesitznahme des eigenen Datenbestands. Mit anderen Worten: Die Unternehmen suchen nach Lösungen, um eine Katalogisierung und Abbildung ihrer Daten aufrechtzuerhalten, die ihre betriebliche Realität widerspiegelt.
Was ist eine Datenkatalogisierung?
Beginnen wir bei den Grundlagen: Mit einer Datenkatalogisierung (auch Data Mapping genannt) können Sie die Zugangspunkte von Daten sowie deren Verarbeitung bewerten und grafisch darstellen. Es gibt verschiedene Arten von Informationen, die katalogisiert werden müssen, z. B:
- die Informationen über die Daten,
- die Verarbeitung der Daten.
Über die Daten
Die Idee eines Data Mappings ist es, an der Datensemantik (Untersuchung der Bedeutungen und ihres Sinns) zu arbeiten
Diese Arbeit findet nicht an den Daten selbst statt, sondern vielmehr über die Metadaten. Sie ermöglichen es, die Bedeutung der Daten und ihren Kontext bestmöglich zu erfassen. Diese Metadaten können den „geschäftlichen“ Namen der Daten, ihren technischen Namen, ihren Speicherort, wann sie gespeichert wurden, von wem sie gespeichert wurden usw. beschreiben.
Durch die Einführung semantischer Regeln und einer gemeinsamen Datensprache über ein Business Glossary können Unternehmen ihre Daten identifizieren und lokalisieren und so allen Mitarbeitern den Zugriff auf die Daten ermöglichen.
Über die Datenverarbeitung
In Bezug auf die Datenverarbeitung ist es wichtig, Folgendes zu erfassen:
- die Datenströme: mit ihren Quellen und Zielen,
- die Datentransformationen: alle Transformationen, welche die Daten bei der Verarbeitung durchlaufen.
Ein mächtiges Werkzeug: Die Data Lineage
Data Lineage ist definiert als der Lebenszyklus eines Datensatzes und ist eine Dokumentation aller Transformationen, die zwischen seinem Anfangszustand und seinem Endzustand stattgefunden haben.
Data Lineage ist eng mit der Katalogisierung der Datenverarbeitung verbunden: Man muss sehen, welche Daten von einer bestimmten Verarbeitung betroffen sind und die Auswirkungen sehr schnell analysieren können. Wenn zum Beispiel eine Verarbeitungsanomalie zu einer Beschädigung von Daten geführt hat, kann man so herausfinden, welche Daten potenziell betroffen sind.
In einem anderen Fall muss das Mapping aus der Sicht eines Datensatzes sagen können, aus welchen Datensätzen der Datensatz hervorgegangen ist. So kann man die Auswirkungen einer Änderung des Quelldatensatzes schnell analysieren, da man die verknüpften Daten schnell wiederfindet.
Die Vorteile der Einführung des Datamappings
Mit einer Mapping-Lösung können Unternehmen auf die geltenden Datenschutzgesetze reagieren, insbesondere auf die DSGVO, indem sie die folgenden Fragen beantworten:
- Wer? Wer ist für einen Datensatz oder eine Verarbeitung verantwortlich? Wer ist für den Datenschutz verantwortlich? Wer sind mögliche Auftragsdatenverarbeiter?
- Was? Welche Art von Daten wird erfasst? Handelt es sich um sensible Daten?
- Warum? Können wir den Zweck der Erfassung und Verarbeitung der Daten ?
- Wo? Wo werden die Daten gespeichert? In welcher Datenbank?
- Wie lange? Wie lange werden die einzelnen Datenkategorien aufbewahrt?
- Wie genau? Was ist der Rahmen und welche Sicherheitsmaßnahmen werden für die sichere Erfassung und Speicherung personenbezogener Daten ergriffen?
Bei der Beantwortung dieser Fragen positionieren sich IT-Manager, Data Lab Manager, Business Analysts oder auch Data Scientists, um die Arbeit mit Daten relevant und effektiv zu gestalten.
Mithilfe dieser Fragen können Unternehmen die Vorschriften einhalten, aber gleichzeitig auch:
- Die Datenqualität verbessern und möglichst viele Informationen bereitstellen, mit deren Hilfe die Nutzer erkennen können, ob die Daten für die Verwendung geeignet sind.
- Die Effizienz und Selbständigkeit ihrer Mitarbeiter durch grafisches und ergonomisches Data Mapping erhöhen.
- Daten im Detail analysieren, um bessere datengestützte Entscheidungen zu treffen und letztendlich eine datengetriebene Organisation zu werden.
Schlussfolgerung
Nur wenn ein Unternehmen über einen korrekt katalogisierten Datenbestand verfügt, wird es in der Lage sein, die Vorteile seiner Daten zu nutzen. Eine qualitativ hochwertige Datenanalyse ist nur möglich, wenn die Daten ordnungsgemäß dokumentiert, rückverfolgbar und für alle zugänglich sind.
Sie suchen nach einem Tool für das Data Mapping?
Weitere Informationen zu unserem Data Catalog erhalten Sie unter den folgenden Links:
- Zeenea Data Catalog
- Zeenea Studio– die Lösung für Datenmanager
- Zeenea Explorer– erleichtert den Alltag Ihrer Datenteams
oder vereinbaren Sie direkt mit uns einen Termin für eine Demo unserer Lösung: