Abstract Graphic World Map Illustration On Blue Background, Big Data And Networking Concept 3d Rendering

Les pièges à éviter pour réussir votre projet de data catalog – L’intégration technique

septembre 29, 2022
septembre 29, 2022
29 septembre 2022

La gestion des métadonnées est une composante importante dans un projet plus global de Data Management, et elle nécessite plus que la simple mise en place d’une solution logicielle de data catalog, aussi connecté soit-il.

Certes le catalogue va permettre d’alléger la charge induite, mais il ne pourra à lui seul garantir le succès.

Inspiré par nos retours d’expérience issus de contextes très variés, cette série d’articles
présente les principaux écueils et idées reçues que vous devez à tout prix éviter lors
de la mise en place d’un catalogue de données à l’échelle de votre entreprise.

Les pièges décrits dans cette série s’articulent autour de quatre thématiques centrales à
la réussite de la démarche :

  1. La culture de la donnée dans l’organisation
  2. Le sponsorship du projet en interne
  3. Le pilotage du projet
  4. L’intégration technique du data catalog

L’intégration du data catalog dans l’écosystème de l’entreprise favorise des opportunités de création de valeur. Il est primordial de bien considérer cet aspect et d’en comprendre les bénéfices.

Toutes les métadonnées ne doivent être saisies à la main

De plus en plus de systèmes produisent, agrègent et permettent une saisie de métadonnées à valeur locale. Ces informations doivent être récupérées et consolidées dans le catalogue – sans double saisie – pour des raisons évidentes d’économie, de fiabilité et de rapidité de mise à disposition.

Le data catalog est donc une opportunité pour consolider ces informations avec les savoirs portés par les collaborateurs sur leurs périmètres respectifs. Cependant, cette consolidation doit être pensée à travers une intégration technique et non un travail à réaliser manuellement. Même s’il semble évident que la double saisie n’est pas une approche pérenne ou efficace, procéder à des imports / exports entre systèmes reposant sur des actions humaines n’est pas non plus une approche pertinente.

La force d’un data catalog doit être sa capacité à ingérer des métadonnées via des chaînes d’intégration techniques, et d’ainsi permettre une synchronisation robuste entre les systèmes.

Le data catalog n’est pas un outil “automagique”

À l’inverse, penser que le data catalog saura extraire tous types de métadonnées quelle que soit la source ou le format, serait plus que trompeur.

Le catalogue doit certes faciliter la récupération de métadonnées, mais certaines ne pourront pas y être déversées automatiquement. Il reste donc toujours un coût porté par l’intervention de contributeurs.

La première raison à cela réside tout simplement dans l’origine même de certaines métadonnées : des informations ne sont peut-être tout simplement pas encore présentes dans des systèmes car elles sont uniquement issues du savoir d’experts. Le data catalog est donc dans ce cas un candidat potentiel pour devenir le système maître afin de les recevoir.

Au contraire, certaines informations peuvent être présentes dans des systèmes sans qu’il soit possible ou presque de les récupérer de façon automatisée et ce, pour de nombreuses raisons. Nous pourrions par exemple citer l’absence d’une interface permettant d’accéder de façon stable aux informations ou encore la nécessité d’avoir recours à de la rétro-ingénierie pour tenter d’isoler des informations pertinentes. Le risque de produire du bruit sur l’information est donc élevé et ceci conduirait à dégrader la qualité du contenu du catalogue, et in fine, à en détourner les utilisateurs.

Le data catalog ne doit pas être connecté à une source unique de métadonnées

Les métadonnées appartiennent à des couches nombreuses et variées. Les sources sont donc multiples et complémentaires pour une compréhension globale. C’est justement le rapprochement de ces informations dans une solution centrale, le data catalog, qui va apporter les éléments nécessaires aux utilisateurs pour leurs besoins.

Choisir un data catalog connecté est un véritable atout, car la découverte des actifs et la récupération de leurs métadonnées associées sont grandement simplifiées par cette automatisation.

Mais cette connectivité peut aussi très souvent s’étendre à d’autres systèmes complémentaires. Ces systèmes sont potentiellement d‘autres systèmes en amont ou en aval du premier, permettant, si désiré, de matérialiser le data lineage et de documenter ainsi les flux et les transformations entre les systèmes.

Les systèmes peuvent aussi être non liés les uns aux autres et juste permettre, par leur ajout au data catalog, de constituer une cartographie exhaustive du patrimoine de l’entreprise.

Enfin, de par la variété des types d’actifs pouvant être documentés dans le data catalog, les différentes sources connectées peuvent aussi contribuer chacune à l’enrichissement d’un univers spécifique dans le data catalog : couche sémantique pour certaines, couche physique pour d’autres etc.

Toujours fidèle à une approche itérative, les sources multiples qui alimenteront le data catalog seront intégrées progressivement – selon une stratégie influencée par le souci de production de valeur – sous le pilotage global du Data Office.

Les 10 pièges à éviter pour réussir son projet de Data Catalog

Si vous souhaitez en savoir plus sur les pièges à éviter pour réussir son projet de data catalog, téléchargez notre eBook gratuitement !

Le 10 Pieges A Eviter Pour Reussir Votre Projet De Data Catalog Mockup

zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

zeenea logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

Related posts

Articles similaires

Ähnliche Artikel

Be(come) data fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

Werden Sie Data Fluent

Entdecken Sie die neuesten Trends rund um die Themen Big Data, Datenmanagement, Data Governance und vieles mehr im Zeenea-Blog.

Melden Sie sich zu unserem Newsletter an und werden Sie Teil unserer Community!

Let's get started
Make data meaningful & discoverable for your teams
Learn more >

Los geht’s!

Geben Sie Ihren Daten einen Sinn

Mehr erfahren >

Soc 2 Type 2
Iso 27001
© 2024 Zeenea - All Rights Reserved
Soc 2 Type 2
Iso 27001
© 2024 Zeenea - All Rights Reserved
Démarrez maintenant
Donnez du sens à votre patrimoine de données
En savoir plus
Soc 2 Type 2
Iso 27001
© 2024 Zeenea - Tous droits réservés.