Les 3 types de métadonnées à maîtriser pour être une entreprise data-centric !

Les métadonnées sont de l’information structurée qui décrit, explique, localise ou facilite l’accès, l’utilisation ou la gestion d’une ressource d’information. La définition la plus citée est certainement « la donnée sur la donnée ». Dans une logique data-centric, quels types de métadonnées une entreprise doit-elle mettre à disposition pour rendre les consommateurs de la donnée plus autonomes et productifs ?

 

NOTRE DÉFINITION DE MÉTADONNÉES

Les métadonnées sont des données contextualisées. En d’autres termes, elles répondent aux interrogations « qui, quoi, où, pourquoi, quand et comment » d’un jeu de données. Elles doivent permettre tant à des équipes IT que business de comprendre et de travailler sur des données pertinentes et de qualité.

 

QUELS SONT CES 3 TYPES DE MÉTADONNÉES ?

Chez Zeenea, nous parlons de trois types de métadonnées au sein de notre data catalog. Voici, entre autres, quelques exemples :

 

  • Les métadonnées techniques : Elles décrivent la structure d’un jeu de données et les informations liées au stockage.

  • Les métadonnées business :  Elles appliquent un contexte métier aux jeux de données : des descriptions (contexte et usage), les propriétaires et référents, des tags et properties dans le but de créer une taxonomie au-dessus des jeux de données qui sera indexée par notre moteur de recherche.

Les métadonnées business sont également présentes au niveau du schéma d’un jeu de données : des descriptions, tags ou encore niveau de confidentialité des données par colonne.

 

  • Les métadonnées opérationnelles : Elles permettent de comprendre quand et comment la donnée a été créée ou transformée : analyse statistique de la donnée, date de mise à jour, provenance (lineage), volume, cardinalité, identifiant des traitements ayant créé ou transformé la donnée, statuts des traitements sur la donnée, etc.

CONCLUSION

La gestion des métadonnées fait partie intégrante d’une stratégie de gouvernance des données agile d’une entreprise. Maintenir un répertoire de métadonnées à jour assure les data consumers d’exploiter des données fiables et pertinentes pour leurs cas d’usage.