Le data management peut être défini comme le processus d’ingestion, de stockage, d’organisation et de maintenance des données créées et collectées par une organisation en vue d’orienter les stratégies et les prises de décision de manière éclairée.
Nous ne vous apprendrons pas que les sujets data ne cessent d’évoluer et de se complexifier au sein des organisations ! Ainsi, toute entreprise qui envisage ces initiatives data et analytiques à grande échelle, se voit de plus en plus confrontée à des données au volume important, des types divers, des formats variés, et des environnements distribués.
Pour tenter d’en maximiser la valeur, les métadonnées sont une réponse permettant de fournir des connaissances sur l’endroit où se trouvent les données, les attributs qu’ils possèdent ou encore la manière dont ils sont liés (également appelé knowledge graph).
Pourtant, la plupart des entreprises n’ont pas encore d’approche formelle de la gestion des métadonnées.
Avec cet article, laissez vous convaincre par sa nécessité…
L’enjeu des métadonnées dans un data management d’avenir
À travers un contexte technologique de plus en plus éparse et complexe, les Responsables des données ou Chief data officers ont pour mission de simplifier et fournir un environnement data cohérent et activable par leurs équipes.
Chez nos clients ayant fait le pari d’initier une gestion des métadonnées, nous constatons un objectif commun : assurer la visibilité des différentes sources et initiatives en matière de données et faire participer de nouveaux acteurs n’ayant pas forcément de profils techniques.
En bref, la nécessité d’aligner une sémantique sur de multiples silos de données est à l’origine de la demande accrue de capacité à gouverner les métadonnées.
Voyez en cette nouvelle discipline de data management, un levier pour mieux décrire vos données, inclure des informations de localisation nécessaires pour leur utilisation ou/et leur protection dans des environnements et sources disparates.
Voici un extrait des interrogations auxquelles vos métadonnées pourront répondre :
- Qui a créé ces données ?
- Qui est responsable de ces données ?
- Dans quelles applications sont-elles utilisées ?
- Quel est le niveau de fiabilité (qualité, vitesse, etc.) de ces données ?
- Quels sont les contextes d’utilisation autorisés (concernant la confidentialité par exemple) ?
- Où se trouvent ces données ?
- D’où proviennent ces données ? (un partenaire, des données ouvertes, en interne etc.)
Créez un template de metamodel !
Dans ce toolkit, nous mettons en avant un ensemble de questions auxquelles vous serez à même de répondre via les métadonnées collectées depuis vos systèmes et vos propres connaissances.
Nos recommandations aux partie prenantes du data management
Pour celles et ceux qui abordent aujourd’hui la gestion des métadonnées dans le cadre de stratégies de data management, nous conseillons de :
- Déployer de manière progressive un catalogue de données (ou data catalog) d’entreprise en adoptant des pratiques de gestion des métadonnées. L’utilisation de data catalog servira, entre autre, à inventorier toutes formes de métadonnées techniques mais également de plus en plus business, opérationnelles et sociales – afin d’améliorer la visibilité des activités de data management.
- Travailler avec des fournisseurs capables d’accepter cette diversité dans leur système et d’opérer dans des infrastructures de data management distribués, indépendants et allant de plus en plus vers le cloud.
- Identifier des cas d’utilisation de metadata management facilement activables afin d’en prouver sa valeur rapidement. Les fournisseurs de solutions retenus devront être ceux favorisant l’automatisation de la découverte, le profilage et l’inventaire des métadonnées ou à minima des tâches les plus fastidieuses ou routinières.
Pour allez plus loin, téléchargez notre guide de metadata management!
Il vous guidera dans la mise en place d’une stratégie de metadata management en seulement 6 semaines.