Quel que soit le secteur d’activité, la maîtrise des données est un axe stratégique clé pour les entreprises. Ces informations sont clés pour innover sur les produits et services de demain. De plus, avec l’essor de nouvelles technologies comme le Big Data, l’IoT ou encore l’intelligence artificielle, les organisations récoltent des volumes exponentiels de données, provenant de sources différentes avec des formats variés.
De plus, avec les réglementations data de plus en plus strictes comme le RGPD, le traitement des données nécessite désormais la mise en place de mesures de sécurité adaptées afin de protéger les fuites d’informations et des traitements abusifs.
Tout l’enjeu se trouve ainsi dans la réappropriation de son patrimoine de données. Autrement dit, les entreprises cherchent des solutions pour maintenir une cartographie des données reflétant leur réalité opérationnelle.
Qu’est ce qu’une cartographie des données ?
Retournons aux bases : une cartographie des données est un “mapping” qui permet d’évaluer et visualiser de manière graphique les points d’entrée des données ainsi que leurs traitements. Il y a plusieurs types d’informations à cartographier, tels que:
- Les informations sur les données
- Les traitements des données
Sur les données
L’idée d’une cartographie sur les données est de travailler sur la sémantique data (étude des sens et de leurs significations)
Ce travail ne se fait pas sur les données elles-mêmes, mais plutôt à travers les métadonnées. Elles permettent d’appréhender au mieux le sens de la donnée et son contexte. Ces métadonnées peuvent représenter le nom “métier” de la donnée, son nom technique, la localisation de la donnée, quand elle à été stockée, par qui, etc.
En mettant en place des règles sémantiques et un langage data commun à travers un business glossary, les entreprises peuvent identifier et localiser leurs données, et donc, faciliter l’accès aux données pour l’ensemble des collaborateurs.
Sur les traitements data
Concernant les traitements des données, il est important de recenser :
- les flux de données: avec leurs sources et leurs destinations,
- les transformations des données : toutes les transformations appliquées à la donnée au cours du traitement.
Un outil puissant : Le Data Lineage
Le Data Lineage se définit comme étant le cycle de vie d’une donnée et un suivi de toutes les transformations qui ont eu lieu entre son état initial et son état final.
Le data lineage est fortement lié à la cartographie d’un traitement des données ; on doit voir quelles données sont concernées par ce traitement et pouvoir analyser les impacts très rapidement. Par exemple, si une anomalie du traitement a provoqué une corruption des données, on peut savoir quelles données sont potentiellement concernées.
Dans un autre cas de figure, la cartographie du point de vue d’une donnée doit pouvoir dire sur quels jeux de données la donnée est issue. Ainsi, on peut analyser rapidement les impacts d’une modification de jeu de données source en retrouvant rapidement les données liées.
Les bénéfices de la mise en place de cartographie des données
Avec une solution de cartographie, les entreprises peuvent donc répondre aux réglementations data, notamment le RGPD, en répondant à ces questions :
Qui ? Qui est responsable d’une donnée ou d’un traitement ? À la protection des données ? Qui sont les éventuels sous-traitants ?
Quoi ? Quelle est la nature des données collectées ? Est-ce des données sensibles ?
Pourquoi ? Pouvons-nous justifier de la finalité de la collecte et du traitement des informations?
Où ? Où sont hébergées les données ? Dans quelle base ?
Jusqu’à quand ? Quelle est la durée de conservation de chaque catégorie de données ?
Comment ? Quel est le cadre et quelles sont les mesures de sécurité mises en place pour une collecte et un stockage sécurisé des données personnelles?
En répondant à ces questions, les Responsable SI, Responsable Data Lab, Business Analyst ou encore Data Scientist se posent pour rendre un travail sur la donnée pertinent et efficace.
Ces questions mises en exergue permettent aux entreprises à être conforme aux réglementation mais également de :
- Améliorer la qualité des données et renseigner un maximum d’informations qui permet aux utilisateurs de savoir si les données sont aptes à être utilisées.
- Rendre les collaborateurs plus efficaces et autonomes dans la compréhension des données grâce à une cartographie des données graphique et ergonomique.
- Analyser de manière profonde les données, afin de pouvoir prendre de meilleures décisions basées sur les données et finalement, devenir une organisation data-driven.
Conclusion
C’est en ayant un patrimoine de données correctement cartographié qu’une entreprise va pouvoir tirer parti de ses données. Une analyse des données de qualité n’est possible qu’avec des data correctement documentées, tracées, et accessibles à tous.
Vous êtes en recherche d’outil de cartographie des données?
Vous pouvez avoir plus d’informations sur notre solution de catalogue de données en visitant les liens ci-dessous :
Zeenea Studio – la solution pour les data managers
Zeenea Explorer – faciliter le quotidien de vos équipes data
ou prendre rendez-vous directement avec nous pour une démo de notre solution :