Mit dem Aufkommen von Big Data wurden die Unternehmen mit einer kolossalen Menge an Daten konfrontiert. Um sie zu verstehen, zu analysieren und die gesetzlichen Anforderungen zu erfüllen, sind die Unternehmen gezwungen, ihren Datenbestand zu erfassen und zu dokumentieren. Dennoch ist es für den Menschen allein aufgrund des ungeheuren Zeitaufwands und eines sehr rudimentären Wissens über Daten sehr schwierig, wenn nicht gar unmöglich, all diese Daten von Hand zu beschreiben und zu kontextualisieren.
Oder aber … Sie entscheiden sich für Data Fingerprinting!
Was ist Data Fingerprinting und was bedeutet es?
Ein Fingerprint ist eine „Signatur“, d. h. ein Fingerabdruck einer Spalte in einem Datensatz. Sein Zweck ist es, die Daten in einen Kontext zu setzen.
Über diese Technologie kann Data Fingerprinting dazu beitragen, ähnliche Datensätze in Ihren Datenbanken automatisch zu erkennen und leichter zu dokumentieren, wodurch die Arbeit der Data Stewards weniger zeitaufwendig und damit im Laufe der Zeit besser aufrechtzuerhalten wird.
Zum Beispiel kann das Data Fingerprinting, natürlich unter Aufsicht des Data Stewards, erkennen, dass die Daten in einer Spalte mit den Informationen „Frankreich“, „USA“ und „Australien“ für „Länder“ stehen.
Data Fingerprinting bei Zeenea
Im Fall von Zeenea und seiner Plattform zur Verwaltung von Metadaten lautet das Ziel , die im Data Catalog katalogisierten Datensätze so automatisch wie möglich zu importieren und auszufüllen. Mithilfe seiner Machine-Learning-Technologien identifiziert Zeenea die Spalten in den Schemata der Datensätze, analysiert sie und weist ihnen eine „Signatur“ zu. Wenn diese Fingerabdrücke ähnlich sind, schlägt der Data Catalog dem Data Steward bei der Analyse vor, die gleichen Informationen über einen Datensatz einem anderen zuzuweisen.
Diese Technologie ist unter anderem auch ein Mittel für Datenschutzbeauftragte (DSB), um sensible oder persönliche Daten, die das Unternehmen in seinen Datenbanken hat, hervorzuheben und auf diese hinzuweisen.