Nous nous sommes rendus les 4, 5 et 6 mars derniers au célèbre Data & Analytics Summit de Londres organisé par Gartner. Un évènement incontournable et inspirant pour les Chief Data Officers et leurs équipes dans la mise en œuvre de leur stratégie data.
Cet article reprend de nombreux concepts de la conférence donnée pour l’occasion : “Metadata Management Is A Must Have Discipline” par Alan Dayley, Gartner Analyst. Ce sujet a su attirer l’attention de plusieurs C-Levels, confirmant que le management de métadonnées est bien une priorité sur les années, voire les mois qui arrivent.
La notion de « métadonnée » appliqué à notre quotidien
Pour introduire la notion de métadonnées, le conférencier a fait un parallèle avec une situation que nous connaissons bien et prenant de plus en plus d’importance dans notre quotidien : identifier et sélectionner ce que nous mangeons. Prenons l’exemple des plats préparés aux nombreux aliments transformés aux caractéristiques nutritives largement modifiées. Ce sont grâce à différents labels, barèmes et descriptions sur le packaging du produit que les consommateurs identifient ce que contient leur assiette.
Ces informations sont, ce que nous appelons, des métadonnées !
Comment les métadonnées apportent-elles de la valeur à l’entreprise ?
Appliquer des métadonnées sur les données permet ainsi à l’entreprise de contextualiser son patrimoine de données. Regroupées en 4 catégories, les métadonnées abordent différents sujets : Data Trust, Regulations & Privacy, Data Security et Data Quality.
Les réflexions de mise en œuvre d’une stratégie de management de métadonnées se portent sur le juste équilibre entre les besoins métier identifiés dans l’entreprise et les réglementations associées aux risques sur les données.
En d’autres termes, où devez-vous investir du temps et de l’argent ? Démocratiser l’accès aux données pour vos équipes data (data scientists, data engineers, data analysts ou domain experts) en vue de gagner en productivité ou se concentrer sur les demandes des organismes de réglementations comme le RGPD, pour ne pas se voir attribuer une lourde amende ?
La réponse est propre à chaque entreprise. Toutefois, Alan Dayley met en avant les 4 cas d’usage identifiés comme prioritaires par les Chief Data Officers et où un management de métadonnées devrait être la clé :
1. Gouverner les données
Dans ce cas d’usage, le speaker confirme que la gouvernance des données ne peut plus être pensée de manière top down. La donnée recoupe différentes équipes et profils aux responsabilités et rôles distincts.
De ce constat, tous doivent travailler ensemble à renseigner et compléter les informations sur la donnée (ses usages, sa provenance, les process, etc.). Contextualiser la donnée est un élément fondamental dans la mise en place d’une gouvernance des données !
2. Gérer les risques et la mise en conformité
Les informations demandées ci-dessous ont été renforcées avec l’arrivée du RGPD. Les entreprises et leurs CDO se doivent de :
- Définir les responsabilités liées aux jeux de données.
- Cartographier les jeux de données.
- Comprendre et identifier les traitements sur les données et les risques associés.
- Avoir un registre de traitements et/ou data lineage.
3. Analyser la donnée
En abordant la gouvernance des données de manière plus collaborative et en favorisant les interactions entre utilisateurs de la donnée, l’entreprise bénéficiera de l’intelligence collective et l’amélioration continue sur la compréhension et l’analyse d’un jeu de données. En d’autres termes, c’est extraire des précédentes découvertes et expérimentations des informations pertinentes pour les prochains utilisateurs de la donnée.
4. Valoriser la donnée
Dans un objectif de monétisation de la donnée, celle-ci n’aura de valeur à proprement parlé que si l’information autour de la donnée est :
- mesurée : sur sa qualité, ses caractéristiques économiques, etc.
- managée : les responsables, documentation renseignée, ses mises à jour, etc.
Comment mettre en place un management des métadonnées ?
Quels que soient les objectifs énoncés ci-dessus, vous ne pourrez les atteindre sans un management de métadonnées. Et de fait, les réponses à ces questions sont bel et bien des métadonnées !
Les recommandations pour entreprendre cet exercice seraient :
- Engager le bon sponsor valorisant l’approche metadata centric dans l’entreprise.
- Identifier le cas d’usage principal que vous souhaitez traiter en premier (comme défini ci-dessus)
- Contrôler que les efforts effectués en termes de métadonnées ne sont pas isolés mais bien centralisés et unifiés.
- Sélectionner un acteur de metadata management solution sur le marché, comme un data catalog.
- Définir par où, qui et comment vous allez démarrer.
Pour conclure cet article, ne pas avoir un management de métadonnées reviendrait à rouler sur une route sans panneau d’indications. Attention à ne pas vous perdre !