data lineage cover blog

Qu’est-ce que le Data Lineage ?

septembre 13, 2021

Vos actifs data doivent être accessibles et exploitables à tout moment, sans aucune interruption. Pour y parvenir, il faut disposer d’une connaissance parfaite de vos données, de leur origine et des différents processus d’exploitation mis en place par votre organisation. Cette connaissance découle du Data Lineage. Explications !

Après la ressource humaine, la donnée s’est imposée comme l’actif le plus précieux des entreprises. La data doit être préservée et valorisée car elle recèle toute l’intelligence d’une organisation. Elle constitue le ciment entre l’entreprise, ses clients et ses partenaires. 

Mais, de ce rôle clé qu’elle occupe dans le quotidien d’une entreprise, découle d’importantes responsabilités pour ceux qui l’exploitent. Comprendre sans être intrusif, connaître sans espionner, l’équation est complexe.

Aussi, de l’entrée en application de BCBS-239 jusqu’à la RGPD, la démarche du législateur vis-à-vis de la donnée consiste à créer les conditions de la transparence pour préserver, autant que possible, le respect de la vie privée et faire en sorte qu’aucune data ne puisse jamais être exploitée au détriment d’un client. 

C’est dans ce contexte d’exigence absolue qu’intervient le Data Lineage. Derrière cet anglicisme (que l’on peut traduire par lignage de données) se cache un concept essentiel : la traçabilité de la donnée. Une traçabilité qui s’entend sur l’ensemble de son cycle de vie, de sa collecte jusqu’à son exploitation, son stockage et sa préservation dans le temps.

 

Data Lineage : Mode d’emploi

La raison d’être du Data Lineage, c’est d’assurer une traçabilité absolue de vos données. Cette traçabilité ne se limite pas à connaître la source d’une information. Cela va même beaucoup plus loin ! 

Pour bien comprendre la nature des informations de lineage, je vous propose de passer par une petite analogie.

 

Imaginons que vous diniez dans un restaurant gastronomique. Le menu comporte des plats aux noms fleuris, composés de nombreux ingrédients plus ou moins exotiques, et dont certains vous sont étrangers. Quand le serveur vous apporte votre assiette, vous goûtez, appréciez, et vous interrogez sur l’origine de ce que vous mangez.

Selon votre prisme, vous n’attendez pas la même réponse.

Gourmet, vous allez chercher à savoir comment les différents ingrédients ont été transformés et assemblés pour aboutir au produit fini. Vous chercherez à connaître les différentes étapes de la préparation, la technique de cuisson, sa durée, les condiments qui l’agrémentent, l’assaisonnement, etc. Bref, vous vous intéressez aux aspects les plus techniques de la préparation finale: la recette. Et vous aurez probablement également une certaine curiosité pour l’origine des matières premières

Contrôleur, vous vous focaliserez plutôt sur la chaîne complète d’approvisionnement et de transformation: identité des fournisseurs, lieux et conditions d’élevage ou de culture des produits bruts, transport, conditionnement, abattage, découpe et préparation, respect de la chaîne du froid, etc. Vous voudrez également vous assurer que cette chaîne d’approvisionnement est conforme aux différents labels ou appellations que le restaurateur met en exergue (origine des ingrédients, bio, “fait maison”, AOC, AOP, etc.).

D’autres pourront privilégier les dimensions historique et culturelle – de quel terroir ou tradition le plat est-il dérivé ou inspiré? Quand et par qui a-t-il été créé initialement? 

D’autres encore (plus rares, j’en conviens) s’intérrogeront sur l’origine phylogénétique de la race de veau préparée par le chef…

Bref, en matière de gastronomie, la question de la provenance n’attend pas une réponse unique et homogène. Et il en est de même en matière de données.

En effet, grâce au Data Lineage, vous disposerez d’un outil de suivi en temps réel de la data.

Une fois collectée, celle-ci fait l’objet d’un suivi constant afin de :

  • détecter et suivre les erreurs éventuelles dans vos processus de traitement des données,
  • piloter et monitorer en continu tous les changements de processus en minorant les risques de dégradation des donnés,
  • gérer les migrations de données,
  • disposer d’une vision à 360° sur vos métadonnées.

Le Data Lineage agit comme une aide au sein de votre entreprise pour vous assurer que vos données émanent d’une source fiable et maîtrisée, que les transformations qu’elles ont pu subir sont connues, suivies et légitimes et qu’elles sont disponibles au bon endroit, au bon moment et pour le bon utilisateur. 

Agissant comme un outil de contrôle, le data lineage a pour mission principale de valider l’exactitude et la cohérence de vos données. Comment ? En permettant à vos collaborateurs de mener des recherches sur l’ensemble du cycle de vie de la donnée, en amont comme en aval, de sa source jusqu’à sa destination finale pour détecter et isoler toute anomalie et la corriger.

 

Les quatre principaux avantages du Data Lineage

 

Le premier avantage issu du déploiement d’un Data Lineage est lié au respect des contingences réglementaires. Parce qu’il contribue à recenser et cartographier l’ensemble des processus de production et d’exploitation de la donnée, le lignage de données contribue à limiter votre exposition au risque de non-conformité des données à caractère personnel. 

Le Data lineage facilite par ailleurs la gouvernance des données car il offre à votre entreprise et à ses collaborateurs un référentiel complet décrivant les flux de données et des métadonnées. Une connaissance indispensable pour concevoir une architecture de données 100% opérationnelle. 

Le lignage des données facilite également l’automatisation de la documentation de vos flux de production de données. Aussi, si vous envisagez de donner une place prépondérante à la data dans votre stratégie de développement, le Data Lineage vous permettra de gagner un temps considérable dans le déploiement de projets. 

Enfin, le dernier grand bénéfice à tirer du lignage de données concerne vos collaborateurs eux-mêmes. Avec des données dont l’origine, la qualité et la fiabilité sont garanties par le Data Lineage, ils peuvent alors s’appuyer pleinement sur vos flux et appuyer leurs actions, au quotidien, sur cet actif indispensable. 

Gagner du temps, garantir la conformité de vos données aux grands principes issus de la RGPD, fluidifier l’action de vos équipes tout en inscrivant votre entreprise dans une nouvelle dimension, fonder sur une stratégie data sans concession… N’attendez plus, lancez-vous !

zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

Be(come) Data Fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

LET’S GET STARTED

Make data meaningful & discoverable for your teams

Démarrer MAINTeNaNT

Donnez du sens à votre patrimoine de données