La gestion des métadonnées est une composante importante dans un projet plus global de Data Management, et elle nécessite plus que la simple mise en place d’une solution logicielle de data catalog, aussi connecté soit-il.
Certes le catalogue va permettre d’alléger la charge induite, mais il ne pourra à lui seul garantir le succès.
Inspiré par nos retours d’expérience issus de contextes très variés, cette série d’articles
présente les principaux écueils et idées reçues que vous devez à tout prix éviter lors
de la mise en place d’un catalogue de données à l’échelle de votre entreprise.
Les pièges décrits dans cette série s’articulent autour de quatre thématiques centrales à
la réussite de la démarche :
- La culture de la donnée dans l’organisation
- Le sponsorship du projet en interne
- Le pilotage du projet
- L’intégration technique du data catalog
—
Rares sont les entreprises dont la donnée est le produit principal. Si la donnée est omniprésente, elle est très souvent un produit dérivé de l’activité de l’entreprise. Il n’est
donc pas surprenant que certains collaborateurs de l’organisation n’aient pas toujours une perception précise de l’importance qu’elle peut revêtir. La culture de la donnée n’est pas innée et le défaut de sensibilisation peut devenir un obstacle majeur dans un projet de déploiement d’un data catalog.
Illustrons-le par quelques idées reçues récurrentes.
Tous les collaborateurs ne sont pas sensibilisés aux enjeux de la gestion des métadonnées
Le premier frein est probablement celui de la compréhension globale de la démarche. Commencer à évoquer l’importance de la gestion de la métadonnée auprès de collaborateurs qui ne perçoivent pas suffisamment le rôle crucial que peut jouer la donnée dans le développement de l’entreprise est voué à l’échec. Il est fort probable qu’il faille prévoir, dans un programme plus vaste, une acculturation d’un maximum de collaborateurs aux enjeux liés à la gestion de la donnée en entreprise.
La plus grande considération à assimiler est probablement que la donnée est un bien commun, signifiant que le ou les dépositaires d’un jeu de données ont l’obligation de le rendre visible et intelligible pour l’entreprise et l’ensemble des collaborateurs.
En effet, l’un des obstacles les plus puissants sur le chemin d’une initiative de metadata management est l’incompréhension quant à l’effort demandé pour produire et maintenir une documentation. Un obstacle exacerbé lorsque la perception de la cible des utilisateurs intéressés est restreinte à quelques personnes déjà sachantes en la matière. Dès lors qu’il est admis que la cible n’est plus ce sous-ensemble, mais l’entreprise toute entière et potentiellement tous les collaborateurs, il devient évident de devoir consigner le savoir sous une forme “scalable”.
Un data catalog n’est pas un outil à tout faire
La culture de la donnée peut aussi concerner l’équipe chargée du pilotage du projet. Plus rare, mais constaté, une connaissance imprécise des outils et de leur finalité peut induire en erreur et conduire à des choix peu optimaux, voire à terme pénalisants.
Le data catalog est un composant logiciel central dans la démarche de gestion des métadonnées, mais il n’est potentiellement pas le seul mobilisé. Il n’est donc pas indiqué d’essayer de tout faire avec cet outil. Cela peut sembler évident, mais en pratique il peut être difficile de bien identifier les limites au-delà desquelles le recours à une solution tierce spécialisée devient nécessaire.
Le data catalog est la clé de voûte de la documentation, et doit être le point d’entrée par lequel doit passer tout collaborateur ayant une question relative à un concept lié à la donnée. Cependant, cela n’en fait pas pour autant la solution dans laquelle tout doit
se trouver. Cette nuance est importante, car référencer ou synthétiser l’information ne
signifie pas forcément porter l’information toute entière.
En effet, nombreux sont les sujets qui remontent lors des phases préparatoires d’un projet de metadata management : la modélisation technique et/ou fonctionnelle, la gestion des habilitations sur les données, le workflow pour les demandes d’accès etc. Tous ces sujets sont importants, portent de la valeur et sont liés à la donnée. Pour autant, ils ne sont pas spécifiquement destinés à être gérés par une solution permettant de documenter vos actifs.
Il est donc important de commencer par identifier ces besoins, de définir une stratégie pour y répondre – supportée par un outillage adapté – puis d’intégrer cet outillage dans un écosystème plus large auquel appartient le data catalog.
Les 10 pièges à éviter pour réussir son projet de Data Catalog
Si vous souhaitez en savoir plus sur les pièges à éviter pour réussir son projet de data catalog, téléchargez notre eBook gratuitement !