Disposer d’un important volume de données ne sert à rien si celles-ci sont de piètre qualité. L’enjeu du Data Quality Management est une priorité pour les entreprises. Outil d’aide à la décision, au pilotage de l’innovation autant que de la satisfaction des clients, veiller sur la qualité des données exige rigueur et méthode.
Produire de la donnée pour produire de la donnée, parce que c’est la mode, que vos concurrents le font, que vous lisez dans la presse professionnelle ou sur Internet, que cela se fait, c’était avant.
Aujourd’hui aucun secteur d’activité ne nie le caractère éminemment stratégique de la donnée. Mais derrière cet engouement généralisé pour la data, le véritable enjeu c’est la qualité de la donnée. Or, si l’on s’en réfère à l’édition 2020 du Gartner Magic Quadrant for Data Quality Solutions, il apparaît que plus d’un quart des données critiques des plus grandes entreprises sont erronées. Une situation qui engendre des coûts directs et indirects.
Erreurs stratégiques, mauvaises décisions, frais divers associés à la gestion des données… Le coût moyen d’une mauvaise Data Quality s’établit à 11 millions d’euros par an. Pourquoi ? Tout simplement parce que désormais l’ensemble des stratégies de votre entreprise sont guidées par votre connaissance de vos clients, de vos fournisseurs, de vos partenaires. Si l’on considère que la donnée est omniprésente dans votre activité, la Data Quality devient l’enjeu central. Gartner n’est pas le seul à souligner cette réalité.
Ainsi à la fin de l’année 2020, le célèbre cabinet IDC révélait dans une étude que les entreprises sont confrontées à de nombreux défis pour tirer profit de l’exploitation de leurs données. Près de 2 entreprises sur 3 considèrent ainsi l’identification des données pertinentes comme un défi et elles sont 76% à juger perfectible la collecte des données et 72% à penser que leurs processus de transformation des données à des fins d’analyse pourraient être améliorés.
Data Quality Management : Une discipline exigeante
Comme en cuisine, plus vous vous appuyez sur des ingrédients de qualité, plus la recette sera appréciée de vos convives. Parce que les données sont des éléments qui doivent amener à de meilleures analyses et donc à de meilleures décisions, il est capital de s’assurer que celles-ci soient de bonne qualité.
Mais qu’est-ce qu’une donnée de qualité ?
Plusieurs critères peuvent entrer en ligne de compte. L’exactitude de la donnée (un numéro de téléphone complet), sa conformité (un numéro se compose de 10 chiffres précédés d’un préfixe national), sa validité (il est toujours utilisé), sa fiabilité (il permet en effet de joindre votre correspondant), etc.
Pour un Data Quality Management efficace, il s’agit de s’assurer que l’ensemble des critères que vous aurez défini pour considérer que la donnée est de qualité soient remplis. Mais attention ! Il faudra encore distinguer faire vivre ces données pour s’assurer de leur qualité dans le temps. Cela signifie que lorsqu’une donnée n’a pas été actualisée depuis un moment, elle est peut-être devenue obsolète. Et une donnée obsolète ou une donnée qui n’est ni actualisée, ni partagée, ni exploitée, perd instantanément de sa valeur car elle ne contribue plus efficacement à nourrir vos réflexions, vos stratégies et vos décisions.
Les “best practices” de la Data Quality
Pour garantir l’intégrité, la cohérence, l’exactitude, la validité et, en un mot la qualité de vos données, vous devrez agir avec méthode. L’étape essentielle d’un projet Data Quality Management efficace, c’est d’abord d’éviter les doublons. Au-delà d’agir comme un poids mort dans vos bases de données, les doublons faussent les analyses et peuvent entamer la pertinence de vos décisions.
Si vous optez pour un outil de Data Quality Management, assurez-vous qu’il intègre un module permettant d’automatiser l’exploitation des métadonnées. En centralisant l’ensemble des connaissances dont vous disposez sur vos données au sein d’une interface unique, leur exploitation est facilitée. C’est le deuxième pilier constitutif de votre projet de Data Quality management.
La définition précise de vos données, leur nomenclature permet d’engager efficacement le processus d’optimisation de la qualité. Ensuite, vos données étant clairement identifiées, classées, il s’agit pour en évaluer la qualité de les mettre en perspective avec les attentes des différents métiers au sein de l’entreprise.
Ce travail de rapprochement entre la nature des données disponibles et leur exploitation par les métiers est un élément déterminant du pilotage de la Data Quality. Mais il faut aussi aller plus loin et s’interroger sur la sensibilité des données. Du caractère sensible ou non de la Data, dépendent vos arbitrages par rapport à l’enjeu de la conformité aux réglementations.
Depuis l’entrée en vigueur du RGPD en 2018, les conséquences de choix hasardeux sur le plan de la sécurité des données sont sévères et pas seulement du point de vue financier.
En effet, les citoyens, vos clients sont désormais très sensibles à la nature, à l’usage et à la protection des données qu’ils partagent avec vous. En pilotant efficacement la Data Quality, vous contribuez également à entretenir la confiance avec vos clients… Une confiance qui n’a pas de prix !