La gestion des métadonnées est une composante importante dans un projet plus global de Data Management, et elle nécessite plus que la simple mise en place d’une solution logicielle de data catalog, aussi connecté soit-il.
Certes le catalogue va permettre d’alléger la charge induite, mais il ne pourra à lui seul garantir le succès.
Inspiré par nos retours d’expérience issus de contextes très variés, cette série d’articles
présente les principaux écueils et idées reçues que vous devez à tout prix éviter lors
de la mise en place d’un catalogue de données à l’échelle de votre entreprise.
Les pièges décrits dans cette série s’articulent autour de quatre thématiques centrales à
la réussite de la démarche :
- La culture de la donnée dans l’organisation
- Le sponsorship du projet en interne
- Le pilotage du projet
- L’intégration technique du data catalog
—
Comme tout projet, la mise en place d’une initiative de metadata management n’échappe pas à la règle et devra être pilotée pour garantir l’atteinte des objectifs dans les meilleurs délais et aux meilleurs coûts. Ce pilotage ne doit cependant pas tomber lui-même dans des travers que nous illustrons ci-après.
La quantité de métadonnées ne doit jamais primer sur la qualité
L’esprit, comme la nature, a horreur du vide. Le data catalog est amené à documenter les actifs liés aux données de l’entreprise. Lors du démarrage du projet, l’absence d’éléments conduit quasi systématiquement à un réflexe : celui de charger beaucoup d’éléments.
Cependant, un bon data catalog ne se caractérise pas par la quantité des objets présents, mais bien par la qualité de son contenu et la cohérence des informations. Ces deux caractéristiques vont donc nécessiter un pilotage de l’activité pour identifier les priorités, d’abord en termes de périmètres à couvrir, puis en termes d’informations à apporter.
Ce qui peut donc apparaître comme frustrant de prime abord – puisque bridant – va très vite s’avérer être pertinent, voire primordial pour le succès du projet. En effet, les utilisateurs vont considérer, à raison, le data catalog comme une source de vérité à l’instar d’un dictionnaire pour la langue parlée. Il est toujours préférable d’offrir, peut-être en premier lieu à une population ciblée, un contenu sélectionné et de qualité, offrant une bonne expérience invitant à revenir spontanément vers l’outil pour de futures recherches.
Un data catalog ne va pas se remplir spontanément, même une fois ouvert aux utilisateurs
Le data catalog est ouvert à de nombreux utilisateurs, dont certains disposent de connaissances sur des actifs présents. Pour autant, l’instauration spontanée de cercles vertueux conduisant à la mise à jour naturelle du contenu du data catalog est très rarement observée, voire jamais.
La réalité est toute autre : il est indispensable d’accompagner au démarrage, mais aussi au-delà.
La qualité des informations renseignées, mais aussi la quantité doivent être pilotées tout comme il est important de re-sensibiliser, présenter, éduquer les équipes contributrices. L’animation autour de la contribution peut aussi trouver un relais dans la mise en place de processus vertueux qui permettront le contrôle et l’incitation à la correction ou l’enrichissement du catalogue.
Il est impossible de fixer tous les objectifs du data catalog dès le démarrage du projet sans jamais les faire évoluer
Le data catalog doit répondre aux attentes de nombreux utilisateurs aux besoins diverses.
Il est donc utopique d’imaginer connaître la liste exhaustive des attentes au démarrage du projet, tout comme il est naïf de considérer cette liste comme définitivement figée dès le lancement du programme. Il est donc du ressort d’un Data Office de collecter et d’analyser continuellement les besoins, de savoir les comprendre et de les prioriser pour les traduire en contenu approprié.
Généralement, les besoins évoluent au rythme de différents paramètres qui sont loin d’être établis au démarrage. Nous pouvons citer comme exemples le niveau de maturité de l’entreprise et de ses collaborateurs sur le sujet de la gestion de la donnée qui va évoluer dans le temps, le développement des usages autour de la donnée, ou encore l’évolution du cadre réglementaire.
Tous ces paramètres ont potentiellement une forte incidence sur le contenu que le data catalog devra couvrir, tant sur l’étendu du périmètre que sur la nature même des informations apportées sur les actifs présents.
Les 10 pièges à éviter pour réussir son projet de Data Catalog
Si vous souhaitez en savoir plus sur les pièges à éviter pour réussir son projet de data catalog, téléchargez notre eBook gratuitement !