data-fingerprinting

Qu’est-ce que le Data Fingerprinting et la détection de similarité ?

décembre 3, 2019
décembre 3, 2019
03 décembre 2019

Avec l’arrivée du Big Data, les entreprises se sont retrouvées avec un nombre colossal de données. Afin de pouvoir les comprendre, analyser, et répondre aux exigences réglementaires, les organisations se voient obligées de renseigner et documenter leur patrimoine de données. Néanmoins, l’humain seul, de par son aspect très chronophage et une connaissance très tribale des données, reste très difficile, voire impossible, de décrire et contextualiser toutes ces données à la main.

Ou sinon… optez pour le Data Fingerprinting !

Qu’est-ce que le Data Fingerprinting

Dans le domaine de la data, un fingerprint, représente une “signature”, autrement dit une empreinte, d’une colonne d’un jeux de données. Sa finalité est de les contextualiser.

Via cette technologie, le Data Fingerprinting peut permettre de détecter automatiquement des jeux de données similaires dans vos bases de données et les documenter plus facilement, rendant la tâche des Data Stewards moins fastidieuse et donc, plus maintenable dans le temps.

Pour exemple, de manière supervisée par le data steward évidemment, le data fingerprinting permet de comprendre que les données d’une colonne reprenant les informations “France”, “États-Unis”, et “Australie” signifient des “Pays”.

data fingerprinting

Le Data Fingerprinting chez Zeenea

Dans le cas de Zeenea et de sa plateforme de gestion de métadonnées, son objectif est d’apporter et renseigner les jeux de données catalogués dans le Data Catalog de la manière la plus automatique possible. Grâce à ses technologies de Machine Learning, Zeenea identifie les colonnes des schémas des jeux de données, les analyse et leur assigne une “signature”. Ainsi, lors de l’analyse, si ces empreintes sont proches, le Data Catalog proposera au Data Steward d’assigner les mêmes informations relative à d’un jeu de données à un autre.

Cette technologie est également un moyen pour les DPO, entre autres, de souligner et pointer les données sensibles ou personnelles que possèdent l’entreprise dans ses bases de données.

zeenea logo

At Zeenea, we work hard to create a data fluent world by providing our customers with the tools and services that allow enterprises to be data driven.

zeenea logo

Chez Zeenea, notre objectif est de créer un monde “data fluent” en proposant à nos clients une plateforme et des services permettant aux entreprises de devenir data-driven.

zeenea logo

Das Ziel von Zeenea ist es, unsere Kunden "data-fluent" zu machen, indem wir ihnen eine Plattform und Dienstleistungen bieten, die ihnen datengetriebenes Arbeiten ermöglichen.

Related posts

Articles similaires

Ähnliche Artikel

Be(come) data fluent

Read the latest trends on big data, data cataloging, data governance and more on Zeenea’s data blog.

Join our community by signing up to our newsletter!

Devenez Data Fluent

Découvrez les dernières tendances en matière de big data, data management, de gouvernance des données et plus encore sur le blog de Zeenea.

Rejoignez notre communauté en vous inscrivant à notre newsletter !

Werden Sie Data Fluent

Entdecken Sie die neuesten Trends rund um die Themen Big Data, Datenmanagement, Data Governance und vieles mehr im Zeenea-Blog.

Melden Sie sich zu unserem Newsletter an und werden Sie Teil unserer Community!

Let's get started
Make data meaningful & discoverable for your teams
Learn more >

Los geht’s!

Geben Sie Ihren Daten einen Sinn

Mehr erfahren >

Soc 2 Type 2
Iso 27001
© 2024 Zeenea - All Rights Reserved
Soc 2 Type 2
Iso 27001
© 2024 Zeenea - All Rights Reserved
Démarrez maintenant
Donnez du sens à votre patrimoine de données
En savoir plus
Soc 2 Type 2
Iso 27001
© 2024 Zeenea - Tous droits réservés.