Comment l’intelligence artificielle renforce les data catalogs ?

juin 5, 2019

05 juin 2019

La machine peut-elle penser ? Nous parlons évidemment d’intelligence artificielle, le “grand mythe de notre temps” !

Une définition simple de l’IA pourrait être : “un ensemble de théories et de techniques mises en œuvre en vue de réaliser des machines capables de simuler l’intelligence.” Parmi elles, nous retrouvons des techniques algorithmiques notamment de deep learning, une méthode d’apprentissage automatique tentant de modéliser des données.

Qui dit “données”, dit être capable de les comprendre et d’y accéder. C’est à l’aide d’un data catalog intelligent que les utilisateurs de la donnée, tels que les data scientists, pourront rechercher facilement et choisir efficacement les bons jeux de données pour leurs algorithmes de machine learning.

Voyons en détails comment.

Moteur de recherche : simplifier la rechercher de jeux de données

En se connectant à toutes les sources de données d’une entreprise, un data catalog peut efficacement remonter un maximum de documentation (autrement appelée métadonnées) depuis leurs systèmes de stockage.

L’ensemble de ces informations, indexées et filtrables dans le moteur de recherche de Zeenea, permet aux utilisateurs d’atteindre rapidement le jeu de données répondant aux besoins de leur programme informatique.

Système de recommandations

Guider l’utilisateur dans ses choix

Un data catalog intelligent est un outil qui repose sur un système de “fingerprinting”.
Cette fonctionnalité intelligente permet de recommander à un utilisateur plusieurs jeux de données pertinents pour ses projets, en se basant, en autres, sur

L’usage de la donnée,
La qualité de la documentation et son scoring,
Ses précédentes recherches,
La navigation des autres utilisateurs.

Inférer plus de sens à un jeu de données

Cette fonctionnalité propose aux personnes en charge d’un jeu de donnée des suggestions quant à sa documentation. Cela peut prendre l’exemple de recommandations sur des tags, des contacts associés ou encore des business terms liés aux jeux de données en se basant sur :

L’analyse de la donnée en elle-même (analyse statistiques),
La ressemblance de son schéma avec d’autres jeux de données
Les liens sur les différents champs des jeux de données.

Contextualiser de manière automatique les jeux de données dans un data catalog permet à l’ensemble des utilisateurs de la donnée de travailler sur une donnée comprise et appropriée pour leur cas d’usage.

Relation entre jeux de données : connaître son cycle de vie

Grâce au fingerprinting, cette même technologie citée plus haut, un data catalog peut reconnaître et relier des jeux de données. Nous parlons de data lineage ; une représentation graphique du cycle de vie de la donnée.

Détection d’erreurs automatiques : être averti sur l’intégralité d’un jeu de données

Afin de pallier à d’éventuels problèmes d’interprétation de la donnée, un data catalog intelligent doit être à même de détecter des erreurs ou incompréhensions sur la qualité et la documentation de la donnée.

Cette fonctionnalité clé, basée sur une analyse de la donnée ou de sa documentation, doit avertir les utilisateurs de la donnée sur son intégrité.

Détection GDPR : être informer sur la sensibilité d’un jeu de données

Un data catalog intelligent doit être capable de détecter des données privées personnelles au sein d’un jeu de données et de le signaler depuis son interface graphique. Cette fonctionnalité permet de répondre à la demande du RGPD de mai 2018 dernier et également d’avertir les potentiels utilisateurs sur le niveau de sensibilité et les usages de la donnée.

← Previous Next →

← Vorherige Nächste →

← Précédent Suivant →

Zeenea Actian Logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

Zeenea Actian Logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

Zeenea Actian Logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

TECHNOLOGIE

SOLUTIONS

CAPACITÉS

APPLICATIONS

SECTEURS

DATA LEADERS

KNOWLEDGE HUB

PRODUCT HUB

À PROPOS

PRENDRE CONTACT

SERVICES

CONVICTIONS

Comment l’intelligence artificielle renforce les data catalogs ?

Moteur de recherche : simplifier la rechercher de jeux de données

Système de recommandations

Guider l’utilisateur dans ses choix

Inférer plus de sens à un jeu de données

Relation entre jeux de données : connaître son cycle de vie

Détection d’erreurs automatiques : être averti sur l’intégralité d’un jeu de données

Détection GDPR : être informer sur la sensibilité d’un jeu de données

Related posts

Articles similaires

Ähnliche Artikel

Le rôle des data catalogs dans l’accélération des initiatives d’IA

[SÉRIE] Data Shopping Partie 2 – L’expérience de Data Shopping dans Zeenea

[SÉRIE] La data marketplace pour le data mesh – Partie 3 : Alimenter la marketplace via des data catalogs par domaine

[SÉRIE] La data marketplace pour le data mesh – Partie 2 : Construire une marketplace à l’échelle de l’entreprise

[SÉRIE] La data marketplace pour le data mesh – Partie 1 : Faciliter la consommation des data products avec les métadonnées

Be(come) data fluent

Devenez Data Fluent

Werden Sie Data Fluent

Product

Capabilities

Use Cases

Resources

Company

Produkt

Funktionalitäten

Use Cases

Ressourcen

Company

Produit

Capacités

Cas d'usage

Ressources

Société