Pendant des années, les entreprises ont été confrontées au défi de collecter de la donnée. Désormais, le véritable enjeu consiste à mettre de l’intelligence dans une profusion de data difficile à maîtriser. De nombreuses technologies et solutions promettent une valorisation optimale de vos données. Parmi celles-ci, on trouve notamment la Data Fabric et le Data Mesh. Si ces concepts peuvent sembler similaires, il existe des différences fondamentales entre ces deux approches. Explications.
Une exigence de connaissance des clients pour se différencier dans un contexte d’hyper-concurrence, des parcours et des usages digitaux qui se développent, les volumes de données à disposition de votre entreprise explosent ! Mais l’abondance d’information n’est rien sans intelligence et sans exploitation fine. Cette réalité influence l’ensemble de l’écosystème de la data.
Si l’on se réfère aux prévisions de Gartner, d’ici 2024, plus de 25 % des fournisseurs de solutions de gestion de données fourniront un support complet de structure de données via une combinaison de leurs propres produits et de ceux de leurs partenaires, contre moins de 5 % aujourd’hui.
Dans ce contexte, plusieurs voies peuvent être explorées, mais deux pistes sortent du lot : la Data Fabric et le Data Mesh.
Qu’est-ce qu’une Data Fabric ?
Le concept de Data Fabric a été introduit par Gartner dès 2019. Le célèbre institut décrit la Data fabric comme l’utilisation combinée de plusieurs technologies existantes pour permettre une implémentation basée sur les métadonnées et une conception d’orchestration augmentée.
En d’autres termes, la Data Fabric constitue un environnement au sein duquel les données et les métadonnées sont analysées en permanence pour faire l’objet d’enrichissements continus et d’une valorisation optimale. Mais, attention ! Une data fabric n’est pas un produit ou une solution finie. C’est un environnement composable qui repose sur la combinaison de différentes solutions ou applications qui interagissent entre elles pour raffiner les données.
La fabrique de données s’appuie sur des API et sur une dimension No Code qui permet de créer des synergies entre des applications et des services variés qui permettent de transformer les données pour en extraire la quintessence de la connaissance tout au long de leur cycle de vie. Très schématiquement, la Data Fabric peut être comparée à une raffinerie avec ses assemblages de tuyaux hétéroclites.
Qu’est-ce que le Data Mesh ?
La paternité du concept de Data Mesh est attribuée à Zhamak Dehghani de Thoughtworks. Dès la fin 2018, la définition était posée. Le principe ? Une nouvelle approche de l’architecture des données, un nouveau mode d’organisation fondé sur le maillage des données. Le Data Mesh repose sur la création d’une structure des données multi-domaines. Les données sont cartographiées, identifiées et réorganisées en fonction de leur usage, de leur cible ou de leur exploitation éventuelle.
Le Data mesh s’appuie sur des principes fondamentaux : le propriétaire des données ou Data Owner, le self-service et l’interopérabilité. Ces trois principes permettent de créer une gestion décentralisée de la donnée. L’avantage ? Faire naître des interactions entre différents domaines de données disparates pour générer toujours plus d’intelligence.
Les principales différences entre Data Fabric et Data Mesh
Pour bien comprendre les différences qui opposent Data Fabric et Data Mesh, commençons par évoquer ce qui les rapprochent. Dans les deux cas, il n’existe pas de solution « clés en mains ».
Alors que la Data Fabric repose sur un écosystème composable de solutions logicielles d’exploitation de la données, le Data Mesh est un mode d’organisation et de gouvernance de la data. Dans le cas de Data Mesh, les données sont stockées de manière décentralisée dans leurs domaines respectifs au sein d’une entreprise. Chaque nœud dispose d’un stockage local et d’une puissance de calcul, et aucun point de contrôle unique n’est nécessaire pour le fonctionnement.
Dans le cas d’une Data Fabric en revanche, l’accès aux données est centralisé avec des clusters de serveurs à haut débit pour le réseau et le partage de ressources hautes performances. Sur le plan de l’architecture de données, il existe également des différences. Ainsi, Data Mesh introduit une perspective organisationnelle, indépendante des technologies spécifiques. Son architecture suit une conception axée sur le domaine et une réflexion sur les produits.
S’ils répondent à des logiques différentes, Data Mesh et Data Fabric servent un même objectif d’exploitation optimale de vos actifs data. En ce sens, malgré leurs différences, il ne faut surtout pas les opposer mais plutôt les considérer comme complémentaires.