Un Data Catalog est complexe mais pas compliqué
Cette dernière proposition découle assez logiquement des précédentes, et servira de conclusion à ce document.
Nous voyons trop de projets de Data Catalog qui tournent au projet interminable de gouvernance des données, et cherchent à régler trop de problèmes d’un seul coup – au détriment de ceux qu’un Data Catalog peut régler très rapidement. Une fois débarrassé de tout ce qui l’alourdit,
le déploiement d’un Data Catalog est l’affaire de quelques jours, et non de quelques mois, pour commencer à produire de la valeur.
Le service rendu par un Data Catalog n’est pas compliqué. Dans sa version la plus épurée, un Data Catalog se présente comme une simple barre de recherche, dans laquelle n’importe quel utilisateur peut saisir quelques mots clé (voire une question en langage naturel), et obtenir une liste de résultats dont les 5 premiers éléments contiennent l’objet le plus pertinent correspondant
à sa recherche, puis disposer de toute l’information dont il a besoin pour consommer les données (pensez à un moteur de recherche web, ou à un site de vente en ligne).
Cette simplicité est fondamentale pour assurer l’adoption du catalogue par les équipes data.
Facialement, le Data Catalog doit être une solution très simple, à l’ergonomie très épurée. Il n’en reste pas moins, qu’à l’instar de n’importe quel moteur de recherche ou de recommandation, la complexité sous-jacente est très forte.
La bonne nouvelle, c’est que traiter cette complexité n’est pas à votre charge, mais précisément à celle du vendeur de la solution.
Chez Zeenea, nous investissons beaucoup sur la structure de l’information (pour construire un graphe de connaissance sémantique), sur l’automatisation et sur le moteur de recherche et de recommandation. Cette complexité n’est pas visible, et constitue la vraie valeur d’un Data Catalog.
L’obsession pour la simplicité est au cœur des valeurs de Zeenea. Chaque fonctionnalité que nous décidons d’ajouter au produit doit répondre affirmativement à l’une des deux questions suivantes :
- La fonctionnalité permet-elle de déployer plus rapidement le catalogue dans l’organisation?
- La fonctionnalité permet-elle aux équipes data de trouver plus rapidement l’information dont elles ont besoin pour mener à bien leurs projets?
A défaut de satisfaire fortement à l’une ou l’autre de ces exigences, les fonctionnalités sont écartées.
Le résultat est que vous pouvez bel et bien connecter Zeenea à vos systèmes opérationnels, configurer et alimenter un premier métamodèle, puis ouvrir le système aux utilisateurs finaux en quelques jours.
Il faudra bien sûr ensuite itérer, étendre, compléter le métamodèle, intégrer d’autres systèmes, etc. Mais la création de valeur est immédiate.
Take Away
Corollaire de la recherche de simplicité, le Data Catalog n’a pas à être une solution hors de prix.
C’est vrai pour le coût d’implémentation – déployer un catalogue connecté ne nécessite pas des milliers d’heures de travail. Nous vous proposons un programme de déploiement sur 3 à 6 semaines, couvrant la formation, l’intégration à vos systèmes et la mise au point d’un premier métamodèle pour 3000 euros.
C’est vrai également pour les coûts logiciels – oubliez les factures à 6 chiffres, Zeenea démarre à 18000 euros annuels, pour 5 data stewards, 50 consommateurs de données et 3 types de connecteurs.