a data catalog is not a compliance solution

Les 7 mensonges de fournisseurs de Data Catalog – n°3 – Un Data Catalog n’est pas une solution de Compliance

juin 25, 2021

Le marché du Data Catalog a beaucoup évolué depuis ses débuts, et ce composant est désormais identifié comme une brique essentielle dans le déploiement d’une stratégie data-centric.

Victime de son succès, ce marché a attiré un grand nombre d’acteurs opérant sur des marchés adjacents et qui ont revu leur positionnement marketing pour se présenter comme solution de Data Catalog.

En réalité, faibles sur les promesses du Data Catalog, ils cherchent à convaincre, avec un succès proportionnel à leurs moyens marketing, qu’un Data Catalog n’est pas simplement un outil de recherche ultra-performant destiné aux équipes data, mais une solution intégrée susceptible d’adresser tout un tas d’autres sujets.

C’est le discours de ces vendeurs de Data Catalog de la dernière heure que l’on souhaite déconstruire dans cette série d’articles.

Un Data Catalog n’est pas une solution de Compliance 

 

Au même titre que la gouvernance, la conformité réglementaire est un sujet fondamental pour toute organisation data-centric.

 

Il existe un nombre impressionnant de réglementations relatives au traitement des données, selon les secteurs d’activité et les géographies. Rien que sur les données personnelles, la RGPD s’impose à tous les États membres de l’Union Européenne mais chaque État bénéficie de marges importantes quant à sa mise en oeuvre, et la plupart disposent d’un arsenal législatif venant compléter, renforcer ou adapter la GDPR (l’Allemagne à elle seule compte plusieurs dizaines de réglementations sectorielles relatives aux données personnelles).

Aux Etats-Unis, sur ce seul sujet des données personnelles, il existe des centaines de lois plus ou moins locales, plus ou moins sectorielles, plus ou moins sérieuses. Et nous ne parlons que des données personnelles… Il existe aussi des réglementations sur les données financières, les données de santé, les données biométriques, les données bancaires, les données de risques, les données assurantielles, etc. Bref, chaque organisation évolue dans un environnement réglementaire spécifique auquel elle doit se conformer.

 

Que signifie être conforme?

La très grande majorité des audits réglementaires reposent sur les même piliers:

  • être capable de fournir une documentation complète et à jour de l’organisation, des procédures et des contrôles mis en place pour satisfaire aux exigences de la norme,
  • être capable de produire la preuve que les procédures décrites dans la documentation sont bel et bien exécutées sur le terrain,
  • démontrer sa capacité à superviser l’ensemble des mesures déployées dans une optique d’amélioration continue

 

Un Data Catalog n’est pas une bibliothèque de procédures, ni un système de consolidation de preuves, et encore moins une solution de supervision de processus.

 

Il ne fait aucun doute que laisser le catalogue prendre en charge ces responsabilités ne peut se faire qu’au détriment de sa simplicité d’usage (les normes sont souvent absconses pour les non initiés), et en mettant en péril son adoption par ceux qui peuvent le plus en tir er bénéfice (les équipes data). 

Faut-il pour autant oublier le Data Catalog dans l’effort de conformité?

 

Non, bien sûr ! Une nouvelle fois, en matière de conformité, il est nettement plus judicieux de confier au Data Catalog une fonction d’acculturation des équipes data.

Et de poser simplement les tags sur les données, permettant à ces équipes d’identifier rapidement les éventuelles normes et procédures auxquelles elles doivent se conformer pour pouvoir les utiliser. Le catalogue peut d’ailleurs aider à poser ces tags, en utilisant plusieurs approches.

Il peut par exemple détecter automatiquement des données sensibles ou personnelles. Mais même boostée au ML, cette détection ne sera jamais parfaite (la notion de “Données Personnelles” définie par la GDPR est par exemple nettement plus large, et difficile à détecter, que la PII nord-américaine). La capacité du catalogue à bien gérer ces tags est donc fondamentale.

Take Away

La conformité réglementaire est avant tout affaire de documentation et de preuves, qui n’ont pas leur place dans un Data Catalog.

Le Data Catalog permet par contre d’identifier (plus ou moins automatiquement) les données soumises à des contraintes réglementaires. La Data Catalog joue un rôle clé dans l’acculturation des équipes data au respect du cadre réglementaire.

Téléchargez notre eBook : Les 7 mensonges des fournisseurs de Data Catalog pour en savoir plus !

zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

Be(come) Data Fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

LET’S GET STARTED

Make data meaningful & discoverable for your teams

Démarrer MAINTeNaNT

Donnez du sens à votre patrimoine de données