Zeenea - Data Innovation Summit 2022

Tout ce que vous devez savoir sur la Data Fabric

avril 13, 2022
avril 13, 2022
13 avril 2022

Dans l’écosystème data, il y a des termes qui résonnent avec insistance. C’est le cas de la Data Fabric (ou fabrique de données) qui, dès 2019, a été identifiée par l’institut Gartner comme une tendance technologique majeure à l’horizon 2022. Derrière ce buzzword se cache une ambition : maximiser la valeur de vos données et accélérer la transformation numérique. Vous aimeriez comprendre comment ? Suivez le guide !

Mettre de l’ordre dans les données, c’est la promesse d’une Data Fabric. Mais elle n’est pas qu’une solution de classement ou de structuration de l’information. En effet, une Data Fabric est un outil conçu pour donner de la valeur à vos données. Et il y a urgence ! Le volume de données générées par les entreprises se développe de manière exponentielle. Chaque seconde, vous disposez d’un peu plus de données à exploiter pour être plus performant, plus en phase avec votre marché ou encore avec vos clients. Les chiffres sont vertigineux et le célèbre cabinet d’analyse IDC estime qu’à l’horizon 2025, le volume de données globalement généré, atteindra 175 zettaoctets. Un volume si conséquent que, s’il était stocké sur des Blu-ray, représenterait une pile de disques faisant 23 fois la distance de la Terre à la Lune.

Qu’est-ce qu’une Data Fabric ?

Si la plupart des professionnels de la gestion des données s’intéressent désormais à la Data Fabric, commençons par définir cette notion. Gartner définit une fabrique de données comme “un concept design faisant office de couche intégrée (integrated layer) de données et de processus de connexion”

Une Data Fabric analyse en continu des combinaisons d’actifs de métadonnées existants, accessibles et déduits, pour fournir une information plus intelligente et soutenir plus efficacement les tâches de gestion des données. La Data Fabric utilise ensuite toutes ces analyses des métadonnées pour concevoir de nouveaux processus et établir un accès normalisé aux données pour tous les métiers au sein de l’entreprise : les développeurs d’applications, les analystes, les Data Scientists etc. 

En d’autres termes, la Data Fabric est une série de processus qui lisent, capturent, intègrent et fournissent des données en fonction de la compréhension de qui utilise ces données, de la classification des types d’usage et du monitoring des changements dans les modes d’usages des données. 

Les avantages de la Data Fabric pour les entreprises

 

Gartner explique que d’ici 2024, le déploiement de Data Fabrics au sein des organisations multipliera par quatre l’efficacité de l’exploitation des données tout en réduisant de moitié les tâches de data management effectuées par les humains. L’institut identifie en ce sens trois grands axes d’opportunités apportées par la fabrique de données :

  • La réduction de 70% des tâches de découverte, d’analyse et d’intégration des données pour les équipes data ;
  • L’augmentation du nombre d’utilisateurs de données, par la réutilisation des datas pour un plus grand nombre de cas d’usage ;
  • La possibilité de tirer davantage de bénéfices de plus de données en accélérant de manière significative l’introduction et l’exploitation de données secondaires et tierces.

D’un point de vue technologique, la Data Fabric s’adapte aux outils déjà en place dans une organisation. Elle peut évoluer à partir des outils d’intégration et de qualité existants, des plateformes de gestion et de gouvernance des données (comme le data datalog par exemple et nous y reviendrons). En ce sens, son modèle de conception est idéal puisqu’il utilise votre technologie existante tout en poursuivant un changement de stratégie dans votre gestion globale des données.

Enfin, la Data Fabric aide les entreprises à briser les silos de données. Vous pouvez alors diminuer les coûts et les efforts de vos équipes data qui doivent sans cesse fusionner, refondre et redéployer des silos de gestion des données avec de nouveaux silos.

La contribution du data catalog à la Data Fabric 

Si l’on reprend la notion de “couche intégrée” de la définition de la Data Fabric et le diagramme proposé par Gartner (ci-dessous) comme guide, on observe que le catalogue de données joue un rôle fondamental dans la constitution d’une Data Fabric. En effet, il influence les couches supérieures qui forment une fabrique de données efficace.

gartner-key-pillars-data-fabric

Couche #1 – L’accès à tous les types de métadonnées

Le catalogue de données est la base de la structure de la Data Fabric – il s’agit de la première couche (grise). Il prend en charge l’identification, la collecte et l’analyse de toutes les sources de données ainsi que tous les types de métadonnées. Le data catalog est un point de départ de la Data Fabric.

Couche #2 – L’activation des métadonnées et le graphe de connaissances

Dans cette deuxième couche de la Data Fabric (jaune), Garner met l’accent sur l‘activation des métadonnées. Cette activation implique l’analyse continue des métadonnées pour calculer des indicateurs clés. Cette analyse est facilitée par l’usage de l’intelligence artificielle (IA), du machine learning (ML) et par l’automatisation de l’intégration des données.

Les modèles et les connexions détectés sont alors transmis au catalogue de données et aux autres outils de Data Management pour formuler des recommandations à l’intention des personnes et des machines concernées par la gestion et l’intégration des données. Pour cela, des analyses continues doivent être réalisées à partir d’un knowledge graph connecté – le moyen de créer et visualiser les relations existantes entre des actifs data de différents types, pour leur donner un sens business et faire en sorte que cet ensemble de relations soit facile à découvrir et à parcourir par tous les utilisateurs dans l’organisation. 

Couche #3 – L’intégration dynamique des données

La troisième couche de Gartner (bleue) s’adresse principalement aux consommateurs techniques de la donnée dans les organisations. Cette couche de la Data Fabric fait référence à la nécessité de préparer, d’intégrer, d’explorer et de transformer les données. L’enjeu ici est de rendre accessible un patrimoine de données provenant d’un large éventail d’outils, à un large éventail d’utilisateurs métiers. Les maître-mots sont ici la flexibilité et la comptabilité pour briser les silos de données, avec les fonctionnalités suivantes :

 

  • Un système de gestion des droits d’accès aux données : la Data Fabric de données doit automatiser l’accès par utilisateur (garde-fou) ;
  • Un système de provisionnement automatisé : tout membre de l’organisation doit être en mesure de demander l’accès à un jeu de données à partir de la Data Fabric – via la création d’un ticket complétée de fonctionnalités de data governance intégrées.
  • Un outil d’exploration des données : la Data Fabric doit permettre aux utilisateurs d’explorer les données (et pas seulement les métadonnées) sans avoir à quitter la fabrique.

 

L’orchestration automatisée des données – telle que décrite dans la partie supérieure de cette troisième couche du diagramme – fait référence au DataOps. Il s’agit d’une pratique collaborative de gestion des données visant à améliorer la communication, l’intégration et l’automatisation des flux de données entre les gestionnaires et les consommateurs de données au sein d’une organisation. Vous trouverez plus d’informations sur ce sujet dans cet article du blog.

Existe-il un outil unique pour la mise en place d’une Data Fabric ?

Comme le précise Gartner, il n’existe pas d’outil unique qui prenne en charge toutes les couches de la fabrique de manière exhaustive. En ce sens, aucun fournisseur n’est en mesure d’offrir une structure de données qui puisse être assimilée à une Data Fabric complète. La solution réside dans l’interaction entre les différentes couches. Une plateforme ouverte est la clé, et les entreprises doivent s’équiper des meilleurs outils data, interconnectés, pour obtenir une Data Fabric digne de ce nom. La constitution d’une fabrique de données doit être considérée comme un marathon et non un sprint, et appréhendée par étapes – le data catalog en constitue la première.

Construire une Data Fabric avec Zeenea

Chez Zeenea, les entreprises qui ont adopté notre Smart Data Catalog ont déjà posé les fondations de leur Data Fabric. En effet, outre l’identification, la collecte et l’analyse de toutes les sources de données ainsi que tous les types de métadonnées (première couche), Zeenea offre toutes les fonctionnalités nécessaires à l’activation des métadonnées via son noyau constitué d’un knowledge graph (Seconde couche). Enfin, notre catalogue adresse la troisième couche : d’une part, via l’intégration des règles de data gouvernance en son sein ; d’autre part via l’application Zeenea Explorer qui fait office de véritable marketplace de la donnée pour que chaque utilisateur métier puisse accéder facilement aux jeux de données clés qui l’intéressent, et ainsi rapidement créer de la valeur à partir des données à disposition. 

 

Pour en savoir plus sur notre Smart Data Catalog, n’hésitez pas à consulter nos deux ebooks ci-dessous ou à nous contacter : 


zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

zeenea logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

Related posts

Articles similaires

Ähnliche Artikel

Be(come) data fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

Werden Sie Data Fluent

Entdecken Sie die neuesten Trends rund um die Themen Big Data, Datenmanagement, Data Governance und vieles mehr im Zeenea-Blog.

Melden Sie sich zu unserem Newsletter an und werden Sie Teil unserer Community!

Let's get started
Make data meaningful & discoverable for your teams
Learn more >

Los Geht’s!

Geben Sie Ihren Daten einen Sinn

Mehr erfahren >

Démarrez maintenant
Donnez du sens à votre patrimoine de données
En savoir plus >