Datenqualität, besser bekannt unter dem englischen Begriff Data Quality, bezieht sich auf die Fähigkeit eines Unternehmens, seine Daten dauerhaft und im Laufe der Zeit zu erhalten. Zum Thema Datenqualität hört man von Fachleuten immer wieder, dass deren Verbesserung die Lösung für alle geschäftlichen Probleme ist und daher oberste Priorität haben sollte.
Die Realität sieht unserer Meinung nach jedoch anders aus: Datenqualität sollte nur als ein Mittel unter vielen betrachtet werden, um die Unsicherheit beim Erreichen der Unternehmensziele zu verringern.
In dieser Serie erfahren Sie alles, was Sie über Datenqualitätsmanagement (DQM) wissen müssen:
- Die neun Dimensionen der Datenqualität
- Die Herausforderungen und Risiken der Datenqualität
- Die wichtigsten Funktionen eines DQM-Tools
- Der Beitrag des Datenkatalogs zum DQM
Im Folgenden möchten wir die auf dem Markt angebotenen DQM-Lösungen genauer untersuchen und so die Herausforderungen dieser Disziplin noch besser verstehen.
Wie geht man vor, um Qualitätsprobleme zu erkennen und zu beheben? Was bieten die marktüblichen Tools an Funktionen zur Verbesserung der Datenqualität?
Ohne zu sehr ins Detail zu gehen, möchten wir Ihnen die Qualitäten eines DQM-Tools anhand der wichtigsten Bewertungskriterien des Magic Quadrant for Data Quality Solutions von Gartner veranschaulichen.
Konnektivität
Ein DQM-Tool muss in der Lage sein, Qualitätsregeln für alle Daten im Unternehmen abzurufen und anzuwenden (interne, externe, On-Prem-, Cloud-, relationale, nicht-relationale Daten usw.). Das Tool muss sich also mit allen wichtigen Daten des Unternehmens verbinden können, um Qualitätsregeln anzuwenden.
Profiling, Messung und Visualisierung von Daten
Um Qualitätsprobleme zu beheben, muss man sie erst einmal erkennen können. Data Profiling ermöglicht es Business-Anwendern und IT-Abteilungen, sich einen Überblick über die Datenqualität zu verschaffen, um Probleme zu erkennen und zu verstehen.
Das Tool muss daher in der Lage sein, die im Abschnitt Die neun Dimensionen der Datenqualität beschriebenen Schritte durchzuführen: Qualitätsprobleme anhand der für das Unternehmen wichtigsten Dimensionen identifizieren.
Monitoring
Das Tool muss in der Lage sein, die Entwicklung der Datenqualität zu überwachen und die Verantwortlichen ab bestimmten Schwellenwerten zu alarmieren.
Standardisierung und Bereinigung von Daten
Es kommt zwangsläufig der Zeitpunkt, an dem die Daten bereinigt werden müssen. Hier sind Funktionen zur Datenbereinigung nötig, um Standards oder Geschäftsregeln zur Änderung von Daten (Format, Werte oder Layout) anzuwenden.
Matching und die Zusammenführung von Daten
Duplikate innerhalb von oder zwischen Datensätzen müssen identifiziert und entfernt werden.
Validierung von Adressen
Unvollständige oder fehlerhafte Adressen müssen standardisiert werden.
Pflege und Anreicherung von Daten
Dies sind die Fähigkeiten eines DQM-Tools, Daten aus externen Quellen zu integrieren, um die Vollständigkeit zu verbessern – und damit den Wert der Daten zu steigern.
Entwicklung und Umsetzung von Geschäftsregeln
Das DQM-Tool muss Geschäftsregeln erstellen, einsetzen und verwalten können, die dann zur Validierung von Daten verwendet werden.
Lösung von Problemen
Das DQM-Tool sollte es Fachbereichen und IT ermöglichen, Datenqualitätsprobleme zuzuordnen, zu lösen und zu überwachen.
Metadaten-Management
Das Tool muss in der Lage sein, alle Metadaten im Zusammenhang mit dem Datenqualitätsprozess zu erfassen und abzugleichen.
Zusammenarbeit
Schließlich muss sich die Lösung an die verschiedenen Rollen im Unternehmen anpassen, insbesondere an nicht-technische Fachanwender.
Werfen Sie einen Blick in unseren Leitfaden zum Data Quality Management
Für weitere Informationen über Datenqualität und DQM, laden Sie sich jetzt unseren kostenlosen “Leitfaden zum Data Quality Management“ herunter!
