Nous observons sur le marché des data catalogs de nombreuses solutions proposant une vue haut niveau des données de l’entreprise grâce à l’effort et l’endurance des équipes data. Cependant, après une courte période d’utilisation, de par les démarches entreprises et les solutions retenues, les projets de data catalog tombent fréquemment en désuétude.
Voici les quelques points qui font que le déploiement d’un data catalog peut capoter… ou pas !
Vos objectifs n’ont pas été définis
Nombre de projets de data catalog sont lancés sous des démarches Big Bang ayant pour objectif de “documenter ses actifs” sans savoir quels réels objectifs poursuivre.
Pour ne pas craindre la mise à mal du projet, nous prônons un modèle basé sur l’itération et la génération de valeur. À l’inverse, cette démarche permet une meilleure maîtrise du risque et la possibilité d’avoir un retour sur investissement plus rapide.
Les premiers effets doivent pouvoir être constatés à la fin de chaque itération. En d’autres termes, l’objectif doit être déterminé pour produire de la valeur concrète pour l’entreprise et surtout vos utilisateurs de données.
À titre d’exemple, si votre objectif est la conformité, démarrez une documentation centrée sur ces propriétés et ciblez un domaine, une zone géographique, une business unit ou un processus d’entreprise particulier.
La motivation de vos troupes s’essoufflera dans le temps
Même s’il est possible d’obtenir l’adhésion et le soutien de l’entreprise pour son effort d’inventaire des données à ses débuts, il est impossible de maintenir ce soutien et d’assurer l’adhésion du projet sans capacités d’automatisation.
Nous pensons que le travail de documentation descriptive doit être le plus limité possible pour ne pas perdre la motivation de vos équipes. La mise en place d’un data catalog doit être un projet progressif et ne durera que si l’effort requis par chacun est supérieur à la valeur qu’ils en obtiendront dans un futur proche.
Vous n’aurez pas la masse critique d’informations nécessaires
Pour qu’un data catalog apporte de la valeur dans votre organisation celui-ci se doit d’être richement rempli. En d’autres termes, lorsqu’un utilisateur recherche une ressource dans un data catalog, il doit la trouver la plupart du temps.
Au démarrage d’un projet de mise en place de data catalog, les chances que les informations souhaitées par un utilisateur ne soient pas disponibles dans le data catalog sont élevées.
Toutefois cette période doit être la plus courte possible afin que vos utilisateurs voient rapidement la valeur générée par le data catalog. En faisant le choix d’une solution tactique, basée sur la technologie de la solution et sa connectivité aux sources d’informations, vous mettrez à disposition et ce, dès son lancement, un catalogue pré-rempli.
Ne reflète pas votre réalité opérationnelle
Outre les défis que posent les projets de mise en œuvre de catalogues, ces derniers doivent présenter un ensemble de caractéristiques automatisées pour être utiles et efficaces dans le temps. Il est surprenant de constater que beaucoup d’entre eux n’ont pas ces exigences minimales pour être viables et sont destinés à une mort lente et douloureuse.
La connectivité des data catalogs à vos sources permettra d’assurer aux consommateurs de données :
- la fiabilité quant aux informations mises à disposition dans le data catalog pour l’analyse et leurs usages dans leurs projets.
- la fraîcheur des informations cataloguées : sont-elles actuelles et à jour, en temps réel ?