Es ist gut, über eine große Menge an Daten zu verfügen. Sie im Alltag pragmatisch, intelligent und raffiniert zu nutzen, ist aber noch besser! Um das zu erreichen, müssen Sie in Ihrem Unternehmen eine echte Datenkultur schaffen. Die Grundlage dieser Kultur ist die Data Curation.
90 % der weltweiten Daten wurden in den letzten zwei Jahren erstellt. Mit dem exponentiellen Wachstum vernetzter Geräte werden die Unternehmen mit einer fatalen Tatsache konfrontiert: Unsere Fähigkeit, Daten zu erzeugen, wird unsere Fähigkeit, sie zu verwalten und zu nutzen, bei weitem übertreffen.
Und das wird wohl auch nicht besser werden! Laut den im Digital Economy Compass 2020 von Statista veröffentlichten Schätzungen hat sich das Volumen der jährlich weltweit erzeugten digitalen Daten in den letzten zehn Jahren mehr als verzwanzigfacht und wird 2021 die Schwelle von 50 Zettabyte überschreiten!
Vor diesem Hintergrund ist es nicht verwunderlich, dass die meisten Unternehmen derzeit nur 12 % der ihnen zur Verfügung stehenden Daten analysieren können! Denn der Grund für das Erfassen, Speichern und Sichern von Daten ist vor allem der geschäftliche Wert, den man vermutlich aus ihnen ziehen kann.
Mit dieser Herausforderung setzt sich das Konzept der Data Curation (Datenkuratierung) auseinander: der entscheidende Schritt, um das Potenzial des umfangreichen Datenbestands einer Organisation auszuschöpfen.
Data Curation: Ein Definitionsversuch
Wenn man die Definition des INIST (Institut de l’Information Scientifique et Technique), das dem CNRS angegliedert ist, zugrunde legt,
„bezeichnet man als Kuratieren alle Aktivitäten und Vorgänge, die für eine aktive Verwaltung digitaler Forschungsdaten über ihren gesamten Lebenszyklus hinweg notwendig sind. Ziel ist es, sie dauerhaft zugänglich, teilbar und wiederverwendbar zu machen. Im Lebenszyklus von Daten können drei Beteiligte identifiziert werden: die Ersteller, meist Forscher, die „Kuratoren“ und die Nutzer.“
Anders ausgedrückt: Die Aufgabe der Data Curation besteht darin, in einem Datenkatalog diejenigen Daten zu identifizieren, die nutzbar gemacht und verarbeitet werden können, und sie in einem zweiten Schritt den Nutzern zur Verfügung zu stellen, die möglicherweise die besten Erkenntnisse daraus ziehen können.
Um eine effektive und relevante Datenkuratierung einzuführen, muss man sich zunächst auf eine genaue Katalogisierung der verfügbaren Daten stützen. Diese anfängliche Katalogisierung bildet die Grundlage für ein pragmatisches und operatives Datenmanagement.
Sobald die Regeln für die Governance festgelegt sind, muss die gesamte Aufmerksamkeit auf die Nutzer der Daten gerichtet werden. Daten sind ein Rohstoff, der nur dann wertvoll ist, wenn er richtig verarbeitet wird. Diese Verarbeitung muss aber als eine Antwort auf die Anforderungen des Nutzers gedacht werden.
Letzterer ist der Initiator eines Data Curation Projekts.
Die Datenkuratierung ist ein iterativer und kontinuierlicher Prozess zur Nutzung von Daten, der sich von allen wichtigen Aufgaben der Data Governance (vom Qualitätsmanagement über den Datenschutz bis hin zum Lebenszyklusmanagement) unterscheidet.
Data Curation: Eine unverzichtbare Voraussetzungen, die unbestreitbare Vorteile bietet
Data Curation ist eine Perspektive für die schnelle und massive Entwicklung der Datenkultur in Ihrer Organisation. Die Erstellung eines Datenverwaltungs- und Datenkuratierungsplans ermöglicht es zunächst, die erzeugten Daten zu erfassen. Dann können die relevantesten ausgewählt und mit Metadaten erweitert werden, die erforderlich sind, damit auch Fachanwender sie verstehen und wiederfinden.
Alle Mitarbeiter im Unternehmen können dann ihre Wahl, ihre Entscheidungen, ihre Strategien und Methoden auf der Grundlage eines systematischen Rückgriffs auf Daten begründen, ohne über spezielle Kompetenzen verfügen zu müssen.
Ziel ist es, die Voraussetzungen dafür zu schaffen, dass Daten systematisch als Grundlage für jedes Projekt und jeden Vorgang genutzt werden und nicht nur von Data-Science-Teams oder Datenexperten verwendet werden.
Um Ihre Strategie der Datenkuratierung effektiv umzusetzen, müssen Sie sich also auf Elemente stützen, die für eine gute Verwaltung Ihrer Datenbestände unerlässlich sind. Der Reaktorkern beschränkt sich nicht auf die Datenkataloge!
Auch wenn sie unverzichtbar ist und direkt aus Ihrer Arbeit bei der Datenkatalogisierung hervorgeht, spielt die Metadaten-Governance eine noch wichtigere Rolle. Dank dieser Metadaten können die Nutzer leichter mit den Datenportfolios interagieren, und zwar in natürlicher Sprache.
Mit Data Curation können Sie endgültig den Weg zu einer datengetriebenen Dynamik einschlagen!