Abstract Graphic World Map Illustration On Blue Background, Big Data And Networking Concept 3d Rendering

Les pièges à éviter pour réussir votre projet de data catalog – L’intégration technique

septembre 29, 2022

29 septembre 2022

La gestion des métadonnées est une composante importante dans un projet plus global de Data Management, et elle nécessite plus que la simple mise en place d’une solution logicielle de data catalog, aussi connecté soit-il.

Certes le catalogue va permettre d’alléger la charge induite, mais il ne pourra à lui seul garantir le succès.

Inspiré par nos retours d’expérience issus de contextes très variés, cette série d’articles
présente les principaux écueils et idées reçues que vous devez à tout prix éviter lors
de la mise en place d’un catalogue de données à l’échelle de votre entreprise.

Les pièges décrits dans cette série s’articulent autour de quatre thématiques centrales à
la réussite de la démarche :

La culture de la donnée dans l’organisation
Le sponsorship du projet en interne
Le pilotage du projet
L’intégration technique du data catalog

—

L’intégration du data catalog dans l’écosystème de l’entreprise favorise des opportunités de création de valeur. Il est primordial de bien considérer cet aspect et d’en comprendre les bénéfices.

Toutes les métadonnées ne doivent être saisies à la main

De plus en plus de systèmes produisent, agrègent et permettent une saisie de métadonnées à valeur locale. Ces informations doivent être récupérées et consolidées dans le catalogue – sans double saisie – pour des raisons évidentes d’économie, de fiabilité et de rapidité de mise à disposition.

Le data catalog est donc une opportunité pour consolider ces informations avec les savoirs portés par les collaborateurs sur leurs périmètres respectifs. Cependant, cette consolidation doit être pensée à travers une intégration technique et non un travail à réaliser manuellement. Même s’il semble évident que la double saisie n’est pas une approche pérenne ou efficace, procéder à des imports / exports entre systèmes reposant sur des actions humaines n’est pas non plus une approche pertinente.

La force d’un data catalog doit être sa capacité à ingérer des métadonnées via des chaînes d’intégration techniques, et d’ainsi permettre une synchronisation robuste entre les systèmes.

Le data catalog n’est pas un outil “automagique”

À l’inverse, penser que le data catalog saura extraire tous types de métadonnées quelle que soit la source ou le format, serait plus que trompeur.

Le catalogue doit certes faciliter la récupération de métadonnées, mais certaines ne pourront pas y être déversées automatiquement. Il reste donc toujours un coût porté par l’intervention de contributeurs.

La première raison à cela réside tout simplement dans l’origine même de certaines métadonnées : des informations ne sont peut-être tout simplement pas encore présentes dans des systèmes car elles sont uniquement issues du savoir d’experts. Le data catalog est donc dans ce cas un candidat potentiel pour devenir le système maître afin de les recevoir.

Au contraire, certaines informations peuvent être présentes dans des systèmes sans qu’il soit possible ou presque de les récupérer de façon automatisée et ce, pour de nombreuses raisons. Nous pourrions par exemple citer l’absence d’une interface permettant d’accéder de façon stable aux informations ou encore la nécessité d’avoir recours à de la rétro-ingénierie pour tenter d’isoler des informations pertinentes. Le risque de produire du bruit sur l’information est donc élevé et ceci conduirait à dégrader la qualité du contenu du catalogue, et in fine, à en détourner les utilisateurs.

Le data catalog ne doit pas être connecté à une source unique de métadonnées

Les métadonnées appartiennent à des couches nombreuses et variées. Les sources sont donc multiples et complémentaires pour une compréhension globale. C’est justement le rapprochement de ces informations dans une solution centrale, le data catalog, qui va apporter les éléments nécessaires aux utilisateurs pour leurs besoins.

Choisir un data catalog connecté est un véritable atout, car la découverte des actifs et la récupération de leurs métadonnées associées sont grandement simplifiées par cette automatisation.

Mais cette connectivité peut aussi très souvent s’étendre à d’autres systèmes complémentaires. Ces systèmes sont potentiellement d‘autres systèmes en amont ou en aval du premier, permettant, si désiré, de matérialiser le data lineage et de documenter ainsi les flux et les transformations entre les systèmes.

Les systèmes peuvent aussi être non liés les uns aux autres et juste permettre, par leur ajout au data catalog, de constituer une cartographie exhaustive du patrimoine de l’entreprise.

Enfin, de par la variété des types d’actifs pouvant être documentés dans le data catalog, les différentes sources connectées peuvent aussi contribuer chacune à l’enrichissement d’un univers spécifique dans le data catalog : couche sémantique pour certaines, couche physique pour d’autres etc.

Toujours fidèle à une approche itérative, les sources multiples qui alimenteront le data catalog seront intégrées progressivement – selon une stratégie influencée par le souci de production de valeur – sous le pilotage global du Data Office.

Les 10 pièges à éviter pour réussir son projet de Data Catalog

Si vous souhaitez en savoir plus sur les pièges à éviter pour réussir son projet de data catalog, téléchargez notre eBook gratuitement !

LIRE L'EBOOK

Le 10 Pieges A Eviter Pour Reussir Votre Projet De Data Catalog Mockup

← Previous Next →

← Vorherige Nächste →

← Précédent Suivant →

Zeenea Actian Logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

Zeenea Actian Logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

Zeenea Actian Logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

TECHNOLOGIE

SOLUTIONS

CAPACITÉS

APPLICATIONS

SECTEURS

DATA LEADERS

KNOWLEDGE HUB

PRODUCT HUB

À PROPOS

PRENDRE CONTACT

SERVICES

CONVICTIONS

Les pièges à éviter pour réussir votre projet de data catalog – L’intégration technique

Toutes les métadonnées ne doivent être saisies à la main

Le data catalog n’est pas un outil “automagique”

Le data catalog ne doit pas être connecté à une source unique de métadonnées

Les 10 pièges à éviter pour réussir son projet de Data Catalog

Related posts

Articles similaires

Ähnliche Artikel

Be(come) data fluent

Devenez Data Fluent

Werden Sie Data Fluent

Product

Capabilities

Use Cases

Resources

Company

Produkt

Funktionalitäten

Use Cases

Ressourcen

Company

Produit

Capacités

Cas d'usage

Ressources

Société

TECHNOLOGIE

SOLUTIONS

CAPACITÉS

APPLICATIONS

SECTEURS

DATA LEADERS

KNOWLEDGE HUB

PRODUCT HUB

À PROPOS

PRENDRE CONTACT

SERVICES

CONVICTIONS

Les pièges à éviter pour réussir votre projet de data catalog – L’intégration technique

Toutes les métadonnées ne doivent être saisies à la main

Le data catalog n’est pas un outil “automagique”

Le data catalog ne doit pas être connecté à une source unique de métadonnées

Les 10 pièges à éviter pour réussir son projet de Data Catalog

Related posts

Articles similaires

Ähnliche Artikel

Le rôle des data catalogs dans l’accélération des initiatives d’IA

[SÉRIE] Data Shopping Partie 2 – L’expérience de Data Shopping dans Zeenea

[SÉRIE] La data marketplace pour le data mesh – Partie 3 : Alimenter la marketplace via des data catalogs par domaine

[SÉRIE] La data marketplace pour le data mesh – Partie 2 : Construire une marketplace à l’échelle de l’entreprise

[SÉRIE] La data marketplace pour le data mesh – Partie 1 : Faciliter la consommation des data products avec les métadonnées

Be(come) data fluent

Devenez Data Fluent

Werden Sie Data Fluent

Product

Capabilities

Use Cases

Resources

Company

Produkt

Funktionalitäten

Use Cases

Ressourcen

Company

Produit

Capacités

Cas d'usage

Ressources

Société