L’arrivée du Big Data n’a simplifié en rien le travail effectué sur les données par les entreprises. Le volume, la variété ou encore les différents systèmes de stockage de la donnée explosent.
Pour preuve, Matt Turck publie ce qu’on appelle le Big Data Landscape. Mise à jour chaque année, cette infographie montre les différents acteurs clés dans divers sous-domaines du paysage Big Data.
Ainsi, avec la révolution du Big Data, il est encore plus difficile de répondre à des questions “primaires” liées à la cartographie des données :
Tant de questions qu’un Responsable SI, Responsable Data Lab, Business Analyst ou encore Data Scientist se posent pour rendre un travail sur la donnée pertinent et efficace.
Ces questions mises en exergue permettent, entre autres, de :
Voir la vidéo de la conférence Data Lineage – cartographier les données de son SI
Ce registre de traitement peut être vue comme une opportunité pour le Big Data ! En répondant aux questions ci-dessus, les entreprises pourront créer une traçabilité sur leurs données au sein des environnements Big Data et obtenir ce que l’on nomme un data lineage. Cet outil permettra de s’assurer que les entreprises respectent bien les principes de finalité et de minimisation de la GDPR.
De plus, être bien organisé et maintenir une traçabilité de ses données est une excellente chose pour la productivité en générale, notamment les data scientists. Ils pourront plus facilement accéder :