La qualité de la donnée, Data Quality en anglais, fait référence à la capacité d’une entreprise à maintenir la pérennité de ses données à travers le temps. À écouter certains professionnels de la qualité des données on peut avoir le sentiment qu’améliorer la qualité des données est la solution à tous les problèmes métiers – que cela devrait donc être une top priorité.
Chez Zeenea, la réalité est, selon nous, à nuancer : la Data Quality devrait être considérée uniquement comme un moyen parmi d’autres de réduire l’incertitude d’atteindre les objectifs de votre entreprise.
Dans cette série d’articles, nous vous livrerons tout ce que les professionnels des données doivent savoir sur la gestion de la qualité des données ou Data Quality Management (DQM) :
- Les neuf dimensions de la qualité de la donnée
- Les défis et risques liés à la qualité des données
- Les principales fonctionnalités d’un outil de DQM
- La contribution du Data Catalog au DQM
Une façon de comprendre les enjeux de la qualité de la donnée est d’étudier les solutions qui existent sur le marché pour la gérer.
Comment fait-on pour identifier et corriger des problèmes de qualité de façon opérationnelle ? Que proposent la plupart des outils du marché comme fonctionnalités pour améliorer la qualité de la donnée ?
Sans rentrer trop dans les détails, je vous propose d’illustrer les qualités d’un outil de Data Quality Management en m’appuyant sur les principaux critères d’évaluation du Magic Quadrant for Data Quality Solutions de Gartner.
La connectivité
Un outil de gestion de la qualité doit être capable de récupérer et d’appliquer des règles de qualité sur toutes les données de l’entreprise (données internes, externes, on-prem, cloud, relationnelles, non relationnelles etc.). L’outil doit donc être capable de se connecter à toutes les données importantes de l’entreprise pour appliquer des règles de qualité.
Le profilage, la mesure et la visualisation des données
Pour pouvoir corriger des problèmes de qualité, encore faut-il pouvoir les détecter. Le profilage des données permet aux utilisateurs métier et à l’IT d’avoir un aperçu des données, dans le but d’identifier et de comprendre les problèmes de qualité des données.
L’outil doit donc être capable de réaliser l’exercice décrit dans la partie Les neuf dimensions de la qualité de la donnée pour identifier les problèmes de qualité à travers les dimensions les plus importantes pour l’entreprise.
Le monitoring
L’outil doit pouvoir surveiller l’évolution de la qualité de la donnée et alerter les responsables à partir de certains seuils.
La standardisation et le nettoyage des données
Vient forcément le moment de nettoyer la donnée. L’objectif ici est de fournir des fonctionnalités de nettoyage des données afin d’appliquer des normes ou des règles métiers pour modifier les données (format, valeurs ou mise en page).
Le matching et la fusion des données
L’objectif est d’identifier et de supprimer les doublons qui peuvent être présents au sein ou entre des ensembles de données.
La validation des adresses
L’objectif est de pouvoir standardiser des adresses qui pourraient être incomplètes ou erronées.
La curation et l’enrichissement des données
Ce sont les capacités d’un outil de Data Quality Management qui permettent d’intégrer des données provenant de sources externes afin d’améliorer la complétude – et donc d’ajouter de la valeur à la donnée.
Le développement et la mise en oeuvre de règles métier
Ce sont les capacités d’un outil de gestion de la qualité permettant de créer, déployer et gérer des règles métier, qui peuvent ensuite être utilisées pour valider les données.
La résolution des problèmes
L’outil de gestion de la qualité devrait permettre aux métiers et à l’IT d’affecter, d’escalader, de résoudre et de surveiller les problèmes de qualité des données.
La gestion des métadonnées
L’outil devrait également être capable de capturer et de réconcilier toutes les métadonnées relatives au processus de qualité des données.
La convivialité
Enfin, la solution doit s’adapter aux différents rôles de l’entreprise, et particulièrement aux utilisateurs métiers non techniques.
Découvrez notre guide de la gestion de la qualité des données
Pour plus d’informations sur la qualité des données et la discipline du DQM, téléchargez notre guide gratuit : « Guide du Data Quality Management » dès maintenant !