Zeenea
  • Produit
        • PRÉSENTATION

        • Plateforme metadata
        • Data catalog
        • Nos connecteurs
        • APPLICATIONS

        • Zeenea Studio
        • Zeenea Explorer
        • DÉMARRER

        • Team Edition
        • Tarification
        • Demander une demo
        • metadata management display
  • Solutions
        • POUR LES DATA LEADERS

        • Chief Data Officers
        • Data Protection Officers
        • Data Owners
        • Data Stewards
        • Data Scientists
        • PAR OBJECTIF

        • Gouvernance des données
        • Data stewardship
        • Business glossary d'entreprise
        • Découverte des données
        • Transformation cloud
        • Mise en conformité
        • https://zeenea.com/fr/project/quelle-organisation-pour-une-gouvernance-des-donnees-agile/
  • Ressources
        • POUR BIEN DÉMARRER

        • Notre librairie data
        • Events & News
        • Blog
        • SUPPORT

        • Customer success
        • Professional services
        • Formation
        • data discovery display
  • Partenaires
  • Notre société
        • ZEENEA LIFE

        • Notre histoire
        • Nos bureaux
        • Contactez-nous
        • NOS CONVICTIONS

        • Metadata management
        • Devenir data fluent
        • Data democracy
        • data governance display
  • Démarrer
  • Français
    • English
Sélectionner une page
Marquez : la solution de découverte de métadonnées chez WeWork

Marquez : la solution de découverte de métadonnées chez WeWork

par Zeenea Software | Déc 10, 2020 | Inspiration Data, Metadata Management

marquez-blog-post-cover

Créée en 2010, WeWork est une société internationale de location de bureaux et d’espaces de travail. Son objectif est de fournir des espaces de collaboration à des équipes de toutes tailles, y compris les start-ups, les PME et les grandes entreprises. Pour y parvenir, l’entreprise propose trois catégories de services :

  • La location d’espace : Pour garantir aux entreprises un espace optimal, WeWork fournit l’infrastructure appropriée : de la réservation de salles de réunion à la location de bâtiments entiers pour les grandes entreprises. La firme doit également s’assurer de proposer les aménagements nécessaires tels qu’une cuisine pour les déjeuners et les pauses café, des WC, etc.
  • Le communautaire : Via son application interne, l’entreprise permet aux membres de WeWork de se connecter les uns aux autres, que ce soit au niveau local dans leur propre espace WeWork, ou au niveau mondial. Par exemple, WeWork peut mettre en relation un développeur ou un graphiste avec une entreprise en recherche depuis l’application à n’importe quel membre, indépendamment de sa localisation. 
  • Les services : WeWork fournit également à ses membres des services divers en cas de problème tels que des services liés à la facturation, à l’informatique, à l’entretien, etc. 

En 2020, WeWork représente :

 

  • Plus de 600 000 adhésions,
  • Implantée dans 127 villes de 33 pays différents,
  • 850 bureaux dans le monde entier,
  • 1,82 milliard de dollars de revenus.

Il est clair que WeWork travaille avec toutes sortes de données provenant de son personnel et de ses clients, qu’il s’agisse de particuliers ou d’entreprises. L’énorme firme avait donc besoin d’une plateforme où ses experts data pourraient consulter, collecter, agréger et visualiser les métadonnées de leur écosystème data. Ce problème a été résolu par la création de Marquez.

Cet article se concentrera sur la mise en œuvre de Marquez par WeWork, provenant principalement de documentations libres et accessibles depuis divers sites, afin d’illustrer l’importance de disposer d’une plateforme de métadonnées pour réellement devenir data-driven.

Pourquoi gérer et utiliser les métadonnées ?

Durant sa conférence « A Metadata Service for Data Abstraction, Data Lineage & Event-based Triggers« , présenté au Data Council en 2018, Willy Lulciuc, data engineer pour le projet Marquez chez WeWork, a expliqué que les métadonnées sont cruciales pour trois raisons : 

  • Garantir la qualité des données : lorsque les données n’ont pas de contexte, il est difficile pour les utilisateurs data de faire confiance à leur patrimoine de données : y a-t-il des champs manquants ? La documentation est-elle à jour ? Qui est le propriétaire des données et en est-il toujours le propriétaire ? L’utilisation de métadonnées permet de répondre à ces questions.
  • Comprendre le data lineage : il est essentiel de connaître l’origine et les transformations de vos données pour être en mesure de savoir réellement par quelles étapes vos données sont passées au fil du temps.
  • Démocratisation des jeux de données : Selon Willy Lulciuc, la démocratisation des données dans l’entreprise est essentielle ! Disposer d’un portail central ou d’une interface utilisateur permettant aux utilisateurs de rechercher et d’explorer leurs jeux de données est l’un des moyens les plus importants pour créer une véritable culture de données en libre-service.

En résumé : créer un écosystème de données “healthy“!

Willy explique que le fait de pouvoir gérer et utiliser les métadonnées crée une culture des données durable où les individus n’ont plus besoin de demander de l’aide pour trouver et travailler avec leurs données. Lors de sa conférence, trois catégories sont présentées. Elles constituent cet “écosystème de données healthy” :

  1. Un écosystème en libre service, où les utilisateurs de données ont la possibilité de découvrir les données et les métadonnées dont ils ont besoin, et d’explorer les ressources de données de l’entreprise lorsqu’ils ne savent pas exactement ce qu’ils recherchent. Ajouter du contexte à ses données, donne la possibilité à tous les utilisateurs et citoyens data de travailler efficacement sur leurs cas d’utilisation
  2. Être autonome en donnant aux utilisateurs data la liberté d’expérimenter avec leurs jeux de données ainsi que de la flexibilité de travailler sur tous les aspects de leurs jeux de données, qu’ils soient entrant ou sortant par exemple.
  3. Enfin, au lieu de dépendre de certains individus ou groupes, un écosystème de données sain permet à tous les employés d’être responsables de leurs propres données. Chaque utilisateur a la responsabilité de connaître ses données, leurs coûts (ces données produisent-elles suffisamment de valeur ?) ainsi que de suivre la documentation de ses données afin d’établir la confiance autour de ses jeux de données.
marquez-a-healthy-data-ecosystem

Les réservations de salles avant Marquez

Comme mentionné ci-dessus, l’utilisation des métadonnées est cruciale pour que les utilisateurs data puissent trouver les données dont ils ont besoin. Afin d’illustrer un cas d’usage concret, M. Willy expose un pipeline de données chez WeWork pour la réservation d’une salle.

Pour un « WeWorker », les étapes sont les suivantes :

 

  1. Trouver un lieu (l’exemple était un complexe d’immeubles à San Francisco)
  2. Choisir la taille de la salle appropriée (généralement divisée en fonction du nombre de participants – dans ce cas, ils ont choisi une salle pouvant accueillir de 1 à 4 personnes)
  3. Choisir la date à laquelle la réservation aura lieu
  4. Décider du créneau horaire pour lequel la salle est réservée ainsi que de la durée de la réunion
  5. Confirmer la réservation

Réservation faite, Willy explique à présent comment une équipe de données standard ferait pour extraire des données depuis ce pipeline. Dans ce cas, l’exercice consiste à trouver le bâtiment qui contient le plus grand nombre de réservations de chambres, et à extraire ces données pour les envoyer à la direction. Les étapes indiquées sont les suivantes :

  1. Lire les réservations de salles à partir d’une source de données (généralement inconnue), 
  2. Faites la somme de toutes les réservations de chambres et afficher les meilleurs emplacements,
  3. Une fois le calcule effectué, le retranscrire dans une source de données de sortie,
  4. Exécuter le job une fois par heure,
  5. Traitez les données par le biais de fichiers .csv et stockez-les quelque part. 

 

Cependant, et même si ces mesures semblent être suffisantes, Willy déclare qu’il y a des problèmes récurrents qui surviennent. Ils sont généralement de trois types :

  • Où puis-je trouver le jeu de données d’entrée du job ?
  • Le jeu de données a-t-il un propriétaire ? Qui ?
  • À quelle fréquence le jeu de données est-il mis à jour ?

La plupart de ces questions sont difficiles à répondre et les jobs finissent par échouer. Sans être sûr de faire confiance à ces informations, il peut être compliqué de présenter des chiffres à la direction ! Ce sont ce genre de problèmes et de questions qui ont fait que WeWork a développé Marquez.

 

Qu’est-ce que “Marquez” ?

Willy définit la plateforme comme une « solution open-source pour l’agrégation, la collecte et la visualisation des métadonnées de l’écosystème de données de WeWork ». En effet, Marquez est un système modulaire et a été conçu comme une solution de gestion des métadonnées hautement extensible et évolutive, indépendante de la plateforme. Il se compose des éléments suivants :

  • Répertoire de métadonnées : il stocke toutes les métadonnées des jobs et des jeux de données, y compris un historique complet et des statistiques au niveau des jobs (c’est-à-dire le nombre total de jobs, la durée moyenne d’exécution, les succès/échecs, etc.)
  • API de métadonnées : des API RESTful permettant à un ensemble de clients de collecter des métadonnées sur la production et la consommation des jeux de données.
  • Interface “user-friendly” des métadonnées : Utilisée pour la découverte de jeux de données, la connexion de plusieurs jeux de données et l’exploration.

 

Le design de Marquez

Marquez fournit des langages qui mettent en œuvre l’API de métadonnées. Cela permet à un ensemble diversifié d’applications de traitement des données de constituer une collection de métadonnées. Dans leur version initiale, ils ont fourni un support à la fois pour Java et Python.

L’API de métadonnées extrait des informations sur la production et la consommation des jeux de données. Il s’agit d’une couche apatride chargée de spécifier à la fois la persistance et l’agrégation des métadonnées. L’API permet aux clients de collecter et/ou d’obtenir des informations sur les jeux de données à destination/en provenance du répertoire de métadonnées.

Les métadonnées doivent être collectées, organisées et stockées de manière à permettre de riches recherches via l’interface utilisateur des métadonnées. Le répertoire de métadonnées sert à cataloguer les informations sur les jeux de données et proprement extraites les métadonnées par l’API.

Selon Willy, ce qui fait un écosystème de données solide est la possibilité de rechercher des informations et des jeux de données. Les jeux de données de Marquez sont indexés et classés à l’aide d’un moteur de recherche basé sur des mots ou des expressions clés ainsi que sur la documentation d’un jeu de données : plus un jeu de données est contextualisé, plus il a de chances d’apparaître en premier dans les résultats de recherche. La documentation d’un jeu de données comprend, par exemple, sa description, son propriétaire, son schéma, son tag, etc.

Vous pouvez voir plus de détails sur le modèle de données de Marquez dans sa présentation → https://www.youtube.com/watch?v=dRaRKob-lRQ&ab_channel=DataCouncil 

marquez-data-model

L’avenir de la gestion des données chez WeWork

Deux ans après le projet, Marquez s’est avéré être d’une grande aide pour le géant du co-working. Leur roadmap à long terme consiste à se concentrer uniquement sur l’interface utilisateur de leur solution, en incluant davantage de visualisations et de représentations graphiques afin de fournir aux utilisateurs des moyens plus simples d’interagir avec leurs données.

Ils proposent également diverses communautés en ligne via leur page Github, ainsi que des groupes sur LinkedIn pour ceux qui sont intéressés par Marquez afin de poser des questions, obtenir des conseils ou même signaler des problèmes sur la version actuelle de Marquez.

 

Sources

A Metadata Service for Data Abstraction, Data Lineage & Event-based Triggers, WeWork. Youtube: https://www.youtube.com/watch?v=dRaRKob-lRQ&ab_channel=DataCouncil

29 Stunning WeWork Statistics – The New Era Of Coworking, TechJury.com:https://techjury.net/blog/wework-statistics/

Marquez: Collect, aggregate, and visualize a data ecosystem’s metadata, https://marquezproject.github.io/marquez/

Marquez: An Open Source Metadata Service for ML Platforms Willy Lulciuc
← Article précédent Article suivant →

Qu’est-ce que la “data literacy” ? Des conseils pour maîtriser vos données.

Qu’est-ce que la “data literacy” ? Des conseils pour maîtriser vos données.

par Zeenea Software | Oct 28, 2020 | Metadata Management

data-literacy-definition

La data literacy est un sujet tendance depuis quelques années, et les entreprises comprennent de plus en plus qu’il s’agit d’une compétence essentielle pour se transformer en organisation data-driven. 

La technologie peut être un point d’échec si elle n’est pas gérée correctement, mais elle n’est souvent pas l’obstacle le plus important. En effet, selon le sondage annuel “Chief Data Officer” de Gartner, les principaux obstacles sont liés à des facteurs culturels – l’humain, la data literacy et les compétences requises

Cependant, de nombreuses entreprises ont encore du mal à comprendre ce qu’est réellement la data literacy, ou à savoir comment repenser leur organisation culturelle pour en faire une culture orientée vers les données. 

Selon leur enquête en 2020, New Vantage Partners a fait ce constat :

« Les entreprises continuent à se concentrer sur l’offre de données et de technologies, au lieu d’accroître la demande de ces dernières par les dirigeants et les employés. Il s’agit d’une poussée technologique plutôt que d’une demande de la part des humains qui veulent prendre davantage de décisions basées sur les données, développer des processus commerciaux plus intelligents ou intégrer des données et des analyses dans davantage de produits et de services ».

Dans cet article, nous aimerions vous éclairer sur ce qu’est la data literacy, pourquoi elle est importante pour votre entreprise, et donner des conseils sur la manière de devenir une organisation data literate. 

La définition de data literacy

Tout comme literacy (alphabétisation en français) signifie avoir « la capacité de lire pour acquérir des connaissances, d’écrire de manière cohérente et de réfléchir de manière critique sur des documents imprimés », la data literacy est la capacité de consommer pour acquérir des connaissances, de produire de manière cohérente et de réfléchir de manière critique sur les données.

En 2019, Gartner a défini la data literacy comme étant  « la capacité à lire, écrire et communiquer autour données dans leur contexte, y compris la compréhension des sources et des constructions de données, des méthodes et des techniques analytiques appliquées – et la capacité à décrire le cas d’utilisation, l’application et la valeur qui en résulte ».

Ainsi, se basant sur ces définitions, nous pouvons conclure que les personnes ayant une bonne data literacy peuvent, entre autres :

  • faire des analyses en utilisant des données, 
  • utiliser les données pour communiquer des idées de nouveaux services, produits, flux ou même stratégies,
  • comprendre les tableaux de bord (visualisations par exemple),
  • prendre des décisions fondées sur les données plutôt que sur l’intuition

En résumé, la data literacy signifie que l’on dispose de compétences nécessaires pour pouvoir utiliser efficacement les données, individuellement et en collaboration. 

Pourquoi la data literacy est-elle importante ?

Gartner s’attend à ce que, d’ici 2020, 80 % des organisations entreprennent un développement délibéré de compétences dans le domaine de la data literacy afin de surmonter les déficiences extrêmes. D’ici 2020, 50 % des organisations ne disposeront pas de compétences suffisantes en matière d’IA et de data literacy pour atteindre leurs objectifs business.

L’augmentation du volume et de la variété des données (ce dont les entreprises sont inondées quotidiennement !) exigent que les employés acquièrent des compétences de haut niveau telles que la pensée critique, la résolution de problèmes, la pensée analytique en utilisant la data. Comme les organisations deviennent de plus en plus data-driven, une mauvaise data literacy deviendra un frein à leur croissance. En effet, dans son enquête « The Human Impact of Data Literacy« , Accenture a constaté que :

  • 75 % des employés sont mal à l’aise lorsqu’ils travaillent avec des données.
  • 1/3 des employés ont pris un jour de congé de maladie en raison de maux de tête liés au travail avec des données.
  • Un manque de data literacy coûte aux employeurs 5 jours de productivité, ce qui se traduit par des milliards de dollars de perte de productivité par employé chaque année.

De plus, une enquête de Deloitte menée en 2019 a révélé que 67 % des cadres ne sont pas à l’aise pour accéder aux ressources de données ou pour les utiliser.

Les données renforcent la capacité des organisations à créer des opportunités business physiques et digitales, en améliorant la précision, en augmentant l’efficacité et en renforçant la capacité de la main-d’œuvre à fournir une plus grande valeur. Il est donc important et essentiel de pouvoir interpréter, analyser et communiquer les résultats des données pour pouvoir découvrir les secrets cachés que peuvent révéler les données pour qu’une entreprise puisse prospérer et avoir l’avantage concurrentiel. 

Conseils pour devenir data literate

Afin de mettre en place un programme de data literacy efficace, voici quelques conseils pour aider votre organisation à maîtriser vos données :

Conseil n°1 – Développer une vision de la data literacy et des objectifs associés

Toute organisation investissant dans les données et les capacités de l’IA devrait déjà avoir entrepris la création d’une vision et d’une feuille de route spécifique aux données. Les responsables des données et de la DSI auront identifié et hiérarchisé les domaines d’activité dans lesquels les données peuvent produire de la valeur.

Ces étapes sont essentielles pour créer une organisation qui maîtrise les données et pour réduire les frictions autour de la compréhension et de l’utilisation des données.

La direction et les RH doivent faire savoir à l’ensemble de l’entreprise que les données sont un actif stratégique qui crée de la valeur. En utilisant la vision des données et la feuille de route comme contexte, ils doivent pouvoir expliquer à tous les employés pourquoi les données sont importantes, comment elles créent de la valeur et comment elles ont un impact sur l’entreprise.

L’absence d’une vision claire des données et d’un plan pour en créer de la valeur sera source de frustration et, par conséquent, les employés ne comprendront pas pourquoi on leur demande de faire des efforts et n’auront donc pas la motivation nécessaire pour les faire.

En outre, une vision de la data literacy devrait détailler les compétences et les capacités souhaitables, ainsi que le niveau de compréhension requis pour les différentes unités et rôles associés.

Les dirigeants, ainsi que les départements de l’IT et des Ressources Humaines doivent créer un cadre pour atteindre les objectifs de maîtrise, mesurer les progrès et créer un moyen de maintenir la data literacy.  Il s’agit notamment de décider comment mesurer et suivre le développement des compétences, et dans quelle mesure les différentes parties de l’organisation doivent utiliser les données pour atteindre leurs objectifs stratégiques.

Conseil n°2 – Évaluer les compétences de vos employés

Idéalement, les compétences en matière de data literacy devraient être évaluées lors du processus de recrutement des nouveaux employés.  De cette façon, les RH sauront déjà quel type d’apprentissage de data literacy devrait être proposé au nouvel employé au fil du temps.

Toutefois, pour les employés actuels, les RH peuvent cartographier les compétences de data literacy en fonction des rôles et responsabilités prévus dans les étapes ci-dessus, et déterminer les lacunes. 

Conseil n°3 – Créer des modules de data literacy

Selon Qlik, seulement 34% des entreprises proposent une formation de data literacy.

Dans la plupart des cas, le département des ressources humaines est chargé d’aider les chefs d’entreprise à identifier et à suivre les domaines d’amélioration et les opportunités de développement pour les employés. Ils sont également chargés d’organiser les procédures d’apprentissage de compétences organisationnelles spécifiques ainsi que le temps nécessaire. Il en va de même lorsqu’il s’agit de la data literacy.

Une fois que les RH et les responsables ont une idée générale des forces et des faiblesses d’un employé ou d’une unité commerciale en matière de data litracy, les RH peuvent commencer à élaborer des programmes d’apprentissage personnalisés et efficaces qui permettent aux employés d’améliorer leur niveau de data literacy et leurs responsabilités analytiques.

Conseil n°4 – Suivre, mesurer et répéter

Il faut du temps pour mettre en place un programme de data literacy efficace. Les chefs d’entreprise doivent permettre à leurs employés d’investir le temps nécessaire à la data literacy et à l’amélioration de leurs compétences.  Avec le temps, la réflexion sur les données fera partie de la culture d’entreprise.

Enfin, il est important de communiquer les progrès de la data literacy à l’échelle de l’entreprise et au niveau individuel. Le suivi et la communication des progrès sont essentiels pour poursuivre l’évaluation de la feuille de route, de la vision et de la data literacy de votre organisation.

Ce type de planification à long terme et d’investissement dans l’éducation de toute l’organisation sur la façon d’accéder, de comprendre et d’analyser les données sur le terrain accélérera les efforts et l’investissement que les équipes de data science, de machine learning et d’IA font.

Les résultats des efforts de data literacy permettront aux organisations d’être enfin en mesure d’adopter et d’exploiter les données dans toute l’entreprise et pour une valeur maximale ! 

← Previous post Next post →
Qu’est-ce que la data preparation ?

Qu’est-ce que la data preparation ?

par Zeenea Software | Juil 20, 2020 | Metadata Management

data-preparation

Lorsqu’on parle de data management, on parle souvent de « data preparation ».

Selon SearchBusinessAnalytics, la data preparation est le processus de collecte, de combinaison, de structuration et d’organisation des données afin qu’elles puissent être analysées dans le cadre d’applications de visualisation, et d’analyse des données. En d’autres termes, il s’agit du processus de nettoyage et de transformation des données brutes avant leur analyse.

La data preparation est souvent un long processus pour les utilisateurs data, mais elle est néanmoins essentielle pour donner un contexte aux données et les transformer en précieuses informations business. En 2016, selon Forbes, 76 % des data scientists ont déclaré que la data preparation était la pire partie de leur travail ! Cependant, des décisions stratégiques précises ne peuvent être prises que par l’analyse de données propres.

 

Comment fonctionne la data preparation

La data preparation est une partie essentielle de nombreuses applications d’entreprise gérées par le département informatique, comme le data warehousing ou la business intelligence. Il s’agit également d’une pratique menée par l’entreprise pour les rapports et les analyses ad hoc, les utilisateurs business compétents en informatique et en technologie, tels que les data scientists, étant régulièrement accablés par des demandes de data preparation personnalisées. 

De nos jours, il y a un intérêt croissant à doter les utilisateurs business d’outils en libre-service pour la data preparation – afin qu’ils puissent manipuler et accéder aux sources de données par eux-mêmes, sans compétences techniques. 

Les étapes de la data preparation sont les suivantes :

 

Étape 1 : Accès aux données

La première étape de la data preparation consiste à pouvoir accéder aux données de n’importe quelle source, quel qu’en soit l’origine, le récit ou le format. La solution optimale pour donner accès aux données à l’échelle de l’entreprise est la mise en place d’un data catalog. Cet outil essentiel est la clé pour commencer votre chemin vers la data preparation. 

 

>> Pour plus d’informations sur Zeenea Data Catalog <<

 

Étape 2 : Découvrir les données

Après l’accès aux données, l’étape suivante consiste à découvrir les données. Le data discovery permet aux entreprises d’évaluer correctement le patrimoine des données. Il aide tous les employés à comprendre leurs données et leur contexte grâce aux métadonnées. Le data discovery est également très utile pour les entreprises qui cherchent à mieux gérer la conformité. Il permet aux entreprises de savoir quelles données sont personnelles / sensibles et où elles peuvent être trouvées. En outre, le data discovery peut favoriser l’innovation, car il débloque des informations essentielles pour satisfaire les clients et obtenir un avantage concurrentiel.

 

Étape 3 : Nettoyer les données

Traditionnellement la partie la plus longue de la data preparation, le nettoyage des données est néanmoins l’une des tâches les plus importantes pour éliminer les mauvaises données. Les mauvaises données peuvent inclure des données obsolètes, des données en double, des données non fiables, etc. Le nettoyage des données comprend donc des tâches fastidieuses telles que le remplissage des informations manquantes, le fait de rendre les données privées ou sensibles, l’ajout de descriptions et la normalisation des modèles de données. 

 

Étape 4 : Enrichir les données

Après avoir nettoyé toutes les données, il est temps de commencer à les transformer et à les enrichir. Cette étape comprend la connexion de vos données avec d’autres sources de données connexes afin d’obtenir des informations plus précises. Un data catalog est également une partie importante de cette étape de data preparation. 

>> Plus d’informations sur les connecteurs de Zeenea <<

 

Étape 5 : Stockage des données

La dernière étape de la data preparation est le stockage des données. En stockant correctement les données de votre entreprise, cela permet aux équipes chargées des données de pouvoir utiliser des données fraîches et propres pour leur analyse. 

 

L’avenir de la data preparation

Initialement axée sur l’analyse, la data preparation a évolué pour traiter un ensemble beaucoup plus large de cas d’utilisation et peut être utilisée par un plus grand nombre d’utilisateurs.

Bien qu’elle améliore la productivité personnelle de ceux qui l’utilisent, elle a évolué pour devenir un outil d’entreprise qui favorise la collaboration entre les professionnels de l’informatique, les experts en données et les utilisateurs professionnels.

← Previous post Next post →
Gartner: Les tendances Data & Analytics en 2020

Gartner: Les tendances Data & Analytics en 2020

par Zeenea Software | Juil 16, 2020 | Inspiration Data, Metadata Management

data-trends

La récente pandémie mondiale a laissé de nombreuses organisations dans un état incertain et fragile. Il est donc fondamental que les entreprises suivent les nouvelles tendances data & analytics afin de rebondir et de gagner un avantage concurrentiel.

De la crise à l’opportunité, le rôle de la data & analytics s’étend et devient plus stratégique et critique. La société en général devient de plus en plus digitale, complexe, mondiale, avec une concurrence toujours plus grande et des clients émancipés. Les perturbations massives, la crise et le ralentissement économique obligent les entreprises à répondre à des demandes jusqu’alors inimaginables pour optimiser les ressources, réinventer les processus et repenser les produits, business modèles et même leur finalité.

Il est donc évident que les data & analytics sont essentielles pour les entreprises qui tentent de se sortir des effets dévastateurs de la crise.

Cependant, le manque de confiance et d’accès aux données n’a jamais été un défi aussi important ! Pour un résulat business réussi, il est essentiel de mettre en place une base de confiance, de sécurité, de gouvernance et de responsabilité autour des données.

Nous partageons dans cet article, les tendances actuelles en data analytics pour aider votre entreprise à prospérer:

 

#1 – L’utilisation de nouvelles techniques d’IA

D’ici la fin 2024, 75% des entreprises passeront du pilotage à l’opérationnalisation de l’IA, entraînant une multiplication par 5 des infrastructures de data analytics.

Dans le contexte actuel, les techniques d’IA telles que le machine learning, l’optimisation et le traitement du langage naturel fournissent des informations et des prévisions essentielles sur la propagation du virus et sur l’efficacité et l’impact des contre-mesures. Avec l’utilisation business de l’IA, les organisations découvrent de nouvelles techniques plus intelligentes, notamment l’apprentissage par renforcement et l’apprentissage distribué, les systèmes interprétables et les infrastructures efficaces qui gèrent les situations complexes. 

 

#2 – Moins de tableaux de bord

D’ici 2025, les data stories seront le moyen le plus répandu de consommer des analyses, et 75 % des stories seront générées automatiquement à l’aide de techniques d’analyse augmentée.

Aujourd’hui, les employés des entreprises ont du mal à savoir sur quelles connaissances agir car les plateformes de Business Intelligence (BI) ne sont pas contextualisées, facilement interprétables ou exploitables par la majorité des utilisateurs. L’analyse et l’exploration visuelles seront remplacées par des expériences plus automatisées et personnalisées sous la forme de data storytelling dynamique. En conséquence du passage à des data stories plus dynamiques et contextuels, le temps passé sur des tableaux de bord prédéfinis diminuera !

 

#3 – Intelligence décisionnelle

D’ici 2023, plus de 33% des grandes organisations auront des analystes pratiquant l’intelligence décisionnelle, y compris la modélisation des décisions.

Une brève définition de l’intelligence décisionnelle est qu’il s’agit d’un domaine pratique qui encadre un large éventail de techniques de prise de décision et les intègre à toutes les parties critiques des personnes, des processus et des technologies. Elle fournit un cadre qui rassemble les disciplines traditionnelles et avancées pour concevoir, modéliser, exécuter et contrôler les modèles et les processus de décision dans le contexte des résultats commerciaux.

L’utilisation de la prise de décision intelligente rassemblera le decision management et des techniques telles que l’analyse descriptive, diagnostique, prédictive et prescriptive.

 

#4 – La gestion des données augmentée : Metadata is the new black

D’ici 2023, les organisations qui utilisent des métadonnées actives et le machine learning pour se connecter dynamiquement, optimiser et automatiser les processus de gestion des données, réduiront de 30 % le temps de livraison de leurs données.

La combinaison d’un volume de données colossal, de problèmes de confiance et la diversité croissante des formats de données, accélère la demande de data management automatisée. Les organisations se doivent donc de savoir quelles sont les données dont elles disposent, ce qu’elles signifient, comment elles apportent de la valeur et si elles sont fiables. Les métadonnées passeront d’un état passif à un état d’utilisation très actif. L’utilisation active s’appuie sur le catalogage, le data discovery automatique, la sémantique par l’interprétation des cas d’utilisation et implique une taxonomie et une ontologie qui sont cruciales pour le data management.

Grâce à un data catalog augmenté, les utilisateurs peuvent améliorer les efforts d’inventaire des données en augmentant considérablement les tâches de recherche, de marquage, d’annotation et de partage des métadonnées.

 

#5 – Vers le Cloud

D’ici 2022, les services de Cloud publics seront essentiels pour 90 % de l’innovation en data et analytics.

Comme le data management accélère son voyage vers le cloud, il en sera de même pour les disciplines de data analytics. Les environnements Cloud permettent de créer un écosystème plus agile, plus fluide et plus diversifié qui accélère l’innovation en réponse aux besoins changeants des entreprises qui ne sont pas facilement accessibles dans les solutions on-premise. Ils offrent également des opportunités concernant l’optimisation des coûts. On s’attend à ce que des offres telles que les capacités « Cloud first » deviennent éventuellement des capacités « Cloud only ».

 

Les clients Gartner peuvent en lire plus dans le rapport « Top 10 Trends in Data and Analytics, 2020« .

 

← Previous post Next post →

Qu’est-ce-que le data discovery ?

Qu’est-ce-que le data discovery ?

par Zeenea Software | Juil 3, 2020 | Metadata Management

data-discovery-datasets

, En cette ère où les données sont omniprésentes, les organisations investissent de plus en plus dans des stratégies de data management afin de créer de la valeur et d’acquérir un avantage concurrentiel. Cependant, selon une étude menée par Gemalto en 2018, il a été constaté que 65% des organisations ne peuvent analyser ou catégoriser toutes les données consommateurs qu’elles stockent.

Il est donc crucial pour les entreprises de chercher des solutions qui leur permettent de valoriser leurs données à partir de métriques, d’aperçus et d’informations en facilitant leur parcours de data discovery.

Définition de data discovery

Les problèmes de data discovery sont partout dans l’entreprise, que ce soit dans le département informatique, business intelligence ou innovation. En intégrant des solutions de data discovery, les entreprises fournissent un accès aux données à tous les employés, ce qui permet aux équipes data et aux business analysts de comprendre et donc de collaborer autour des données.

Il est également très utile pour les entreprises qui cherchent à mieux gérer la conformité. Il permet aux organisations de savoir quelles données sont personnelles/sensibles et où elles peuvent être trouvées. Le data discovery peut également stimuler l’innovation, car il débloque des informations essentielles pour satisfaire les clients et obtenir un avantage concurrentiel.

Du data discovery manuel au data discovery intelligent

Depuis 20 ans, avant les techniques de machine learning avancées, les data stewards cartographiaient leurs données en utilisant la seule puissance du cerveau humain ! Ils réflechissaient de manière critique aux données dont ils disposaient, à leur emplacement de stockage et aux besoins pour satisfaire par le client final. Les Data Stewards s’occupaient généralement des règles de documentation des data assets qui guidaient le processus de data discovery. Dans ces approches manuelles, généralement réalisées à l’aide de feuilles Excel, les utilisateurs conceptualisaient et dessinaient des cartes pour comprendre l’organisation de leurs données.

De nos jours, avec l’avancement de la technologie, la définition du data discovery inclut les moyens automatisés de présentation des données. La découverte intelligente de données représente une nouvelle vague de technologies data qui utilisent l’analyse augmentée, le machine learning et l’intelligence artificielle.

Non seulement elle prépare, conceptualise et intègre les données, mais elle les présente également au moyen de tableaux de bord intelligents pour révéler des modèles et valeurs business cachés.

Les avantages du data discovery

Les données d’entreprise se déplacent d’un endroit à l’autre à la vitesse de la lumière, et sont stockées dans diverses sources de données. Les employés et les partenaires accèdent à ces données, de partout et à tout moment. L’identification, la localisation et la classification de vos données devraient donc être la priorité, afin de les protéger et d’en tirer des informations !

Les avantages du data discovery sont les suivants :

  • Meilleure compréhension des données d’entreprise, de leur emplacement, des personnes qui peuvent y accéder / du lieu où elles se trouvent, et de la manière dont elles seront transmises,
  • Classification automatique des données en fonction du contexte,
  • Gestion des risques et respect de la réglementation,
  • Visibilité complète des données,
  • Identification, classification et suivi des données sensibles,
  • Capacité d’appliquer des contrôles de protection aux données en temps réel sur la base de politiques et de facteurs contextuels prédéfinis

Le data discovery permet de correctement évaluer l’ensemble des données d’entreprise.

D’une part, il aide à mettre en œuvre les mesures de sécurité appropriées pour prévenir la perte de données sensibles et éviter des conséquences financières et de réputation dévastatrice pour l’entreprise.

D’autre part, elle permet aux équipes d’approfondir les données afin d’identifier les éléments spécifiques qui révèlent les réponses et de trouver des moyens de montrer les réponses. C’est une situation où tout le monde est gagnant !

Vous voulez en savoir plus sur le data discovery ?

Téléchargez notre livre blanc : « Le Data Discovery vu par les Géants du Web »

Dans ce livre blanc, nous faisons un focus sur le contexte et la mise en œuvre des solutions de data discovery développées par les grandes entreprises du web, dont certaines font partie du célèbre «Big Five» ou «GAFAM» (Google, Apple, Facebook, Amazon, Microsoft).

data-discovery-mockup-FR-no-shadow
télécharger le livre blanc
← Previous post Next post →

Formez une équipe de citizen data scientists

Formez une équipe de citizen data scientists

par Zeenea Software | Juin 8, 2020 | Metadata Management

”There aren’t enough expert data scientists to meet data science and machine learning demands, hence the emergence of citizen data scientists. Data and analytics leaders must empower “citizens” to scale efforts, or risk failure to secure data science as a core competency”. – Gartner 2019

Les efforts et investissements dans la data science ont battu tous les records en 2019 ! La demande de data scientists est donc plus forte que jamais. Cependant, la demande est bien plus élevée que l’offre actuelle sur le marché. Les entreprises se retrouvent à se battre pour leur place, et dans certains cas, pour leur survie.

En réponse à ce challenge, un rôle analytique important a été créé pour faire le lien entre les data scientists et les fonctions métiers : le citizen data scientist.

Qu’est-ce qu’un citizen data scientist ?

Gartner définit le concept du citizen data scientist comme « un ensemble de capacités et de pratiques qui permet aux utilisateurs d’extraire des informations prédictives et normatives sur les données sans avoir besoin d’être aussi qualifiés et techniquement sophistiqués que les data scientist experts« . Attention, un « citizen data scientist » n’est pas un poste. Il s’agit d’un « power user » qui peut effectuer des tâches analytiques simples.

En règle générale, les citizen data scientists n’ont pas de compétences en codage. Néanmoins, ils peuvent construire des modèles en utilisant des outils de “drag and drop” et faire fonctionner des data pipelines ainsi que des modèles pré-construits à l’aide d’outils tels que Dataiku. Les citizen data scientists ne remplacent pas les data scientists experts ! Ils apportent leur propre expertise mais n’ont pas les compétences techniques pour la data science avancée.

Le citizen data scientist est un rôle qui a évolué comme une « extension » d’autres rôles au sein de l’organisation. Cela signifie que les organisations doivent créer la fiche persona du citizen data scientist. Le potentiel des citizen data scientists varie en fonction de leurs compétences et de leur intérêt pour la data science et du machine learning. Les rôles qui entrent dans la catégorie du citizen data scientist sont les :

  • Business analysts
  • BI Analysts / Developers
  • Data Analysts
  • Data Engineers
  • Application Developers
  • Business line manager

 

Conseils pour la construction de votre équipe de citizen data scientists

Comme les compétences d’experts en data science ont tendance à être assez coûteuses et difficiles à obtenir, le recours à un citizen data scientist peut être un moyen efficace de combler ce manque.

Voici comment vous pouvez renforcer les capacités de vos équipes de data science :

 

Briser les silos d’entreprises

Comme vous l’avez déjà entendu à maintes reprises, de nombreuses organisations ont tendance à fonctionner de manière indépendante. Comme mentionné ci-dessus, tous les rôles sont importants dans la stratégie de gestion des données d’une organisation, et ils ont tous exprimé leur intérêt pour monter en compétence en data science et machine learning. Cependant, la plupart de ces connaissances sont gardées par des départements ou rôles spécifiques. Par conséquent, les efforts de data science sont souvent invalidés et non-exploités. Le manque de collaboration entre les différents rôles rend difficile le travail des citizen data scientists !

En établissant une communauté de rôles business et informatiques qui fournit des lignes directrices et/ou des ressources détaillées, les entreprises peuvent donner aux citizen data scientists les moyens d’accéder et comprendre leurs données. Il est donc important pour les entreprise d’encourager le partage des efforts de data science dans toute l’organisation et ainsi, de briser les silos data !

 

Fournir une technologie de data analytics augmentée

La technologie alimente la montée en puissance du citizen data scientist. Les fournisseurs traditionnels de BI, tels que SAP, Microsoft et Tableau Software, ont des fonctionnalités qui permettent l’analyse statistique et prédictive avancée. Parallèlement, les plateformes de data science et de machine learning telles que SAS, H2O.ai et TIBCO Software, fournissent aux utilisateurs qui ne disposent pas de capacités d’analyse avancées, des « analyses augmentées ». L’analyse augmentée s’appuie sur du machine learning automatisé pour transformer la manière dont le contenu analytique est développé, consommé et partagé. Elle comprend :

La préparation de données augmentée : l’automatisation de machine learning pour augmenter le profilage, la qualité, la modélisation, l’enrichissement et le catalogage des données.

La découverte de données augmentée : permet aux utilisateurs business et techniques de trouver, visualiser et analyser de manière automatique les informations pertinentes à leurs usages telles que des corrélations, des groupes, des segments et des prédictions, sans avoir à construire des modèles ou à écrire des algorithmes.

La data science et le machine learning augmentés : l’automatisation des aspects clés de la modélisation analytique avancée, tels que la sélection des caractéristiques, la sélection des algorithmes et les processus d’étapes qui prennent du temps.

En intégrant les outils et les solutions nécessaires et en augmentant les ressources et les efforts, les entreprises peuvent désormais construire leur équipe de citizen data scientists !

 

Donner aux citizen data scientist les moyens de gérer leurs données grâce à une plateforme de gestion des métadonnées

La gestion des métadonnées est une discipline essentielle pour les entreprises qui souhaitent soutenir l’innovation ou les initiatives de conformité réglementaire sur leurs actifs de données. En mettant en œuvre une stratégie de gestion des métadonnées, dans laquelle les métadonnées sont bien gérées et correctement documentées, les citizen data scientists sont en mesure de trouver et d’extraire facilement des informations pertinentes à partir d’une plateforme intuitive.

Découvrez nos conseils pour démarrer un metadata management en seulement 6 semaines en téléchargeant notre nouveau livre blanc « Le guide du metadata management« .

← Previous post Next post →
Comment éviter le départ de vos data scientists ?

Comment éviter le départ de vos data scientists ?

par Zeenea Software | Mai 29, 2020 | Metadata Management

En 2019, le Data Scientist a été nommé “le poste le plus prometteur” par LinkedIn. Que ce soit une entreprise du CAC 40 ou bien une PME / TPE, la constitution d’une équipe de professionnels de la data science était une priorité dans leurs stratégies business. En effet, l’année 2019 a battu tous les records d’investissements en IA et en data science !

Malgré toutes ces tendances positives, les Data Scientists finissent souvent par démissionner et changer d’entreprise rapidement. Comment cela se fait-il ? Analysons la situation.

 

Ils ne passent pas leur temps à faire ce pour quoi ils ont été engagés

Malheureusement, de nombreuses entreprises qui embauchent des data scientists ne disposent pas d’une infrastructure d’IA adaptée. De nombreuses enquêtes suggèrent qu’environ 80% du temps des data scientists est consacré à nettoyer, organiser et trouver les données d’entreprise (au lieu de les analyser), ce qui fait partie des tâches qu’ils apprécient le moins ! Dans l’article « How We Improved Data Discovery for Data Scientists at Spotify« , Spotify explique qu’au début, « les jeux de données manquaient de documentation claire, ce qui rendait la recherche de données difficile ». Comme quoi, même les data scientists travaillant pour les Géants du Web ont déjà ressenti de la frustration dans leur recherche de données !

La plupart des data scientists décident de partir de leur entreprise parce qu’ils finissent par filtrer les déchets dans leur écosystème data. Avoir des données propres et bien documentées est essentiel pour que vos data scientists puissent non seulement mieux trouver, découvrir et comprendre les données de l’entreprise, mais aussi gagner du temps sur des tâches fastidieuses et produire des informations exploitables.

 

Les objectifs business et data science ne sont pas alignés

Avec toutes les tendances d’IA et de machine learning, les dirigeants et investisseurs veulent présenter leurs projets de data science à la pointe des dernières avancées technologiques. Ils engagent souvent des experts en IA et data en pensant qu’ils atteindront leurs objectifs commerciaux en deux fois plus de temps. Or, c’est rarement le cas ! Les projets de data science impliquent généralement beaucoup d’expérimentation, de méthodes “test and learn” et d’itérations du même processus avant d’atteindre le résultat final.

Beaucoup d’entreprises augmentent leur embauche de data scientists afin d’accroître la production d’analyses data. Cependant, cette recherche n’a souvent qu’un « impact local » dans des parties spécifiques de l’entreprise, passant inaperçue aux autres départements qui qui pourraient finalement la prendre en compte dans leurs décisions !

Il est donc important que les deux parties travaillent ensemble en établissant une communication solide. L’alignement des objectifs commerciaux avec les objectifs de la data science est clé pour ne pas perdre vos data scientists. En utilisant une approche de Data Ops, les data scientists sont capables de travailler dans un environnement agile, collaboratif et propice au changement, qui favorise la communication entre les départements métiers et informatiques.

 

Ils ont du mal à comprendre et à contextualiser les données au niveau de l’entreprise

La plupart des organisations ont mis en place de nombreuses solutions complexes, généralement mal comprises par la majorité de l’entreprise, ce qui rend difficile la formation de nouveaux employés dans le domaine de la data science. Sans une solution centralisée unique, les spécialistes des données se retrouvent à passer par différentes technologies, perdant de vue quelles données sont utiles, à jour et de qualité pour leurs usages.

Ce manque de visibilité sur les données est frustrant pour les data scientists qui, comme mentionné ci-dessus, passent la majorité de leur temps à chercher des données dans de multiples outils et sources.

En mettant en place une source unique de vérité, les experts en data science sont en mesure de visualiser les données de leur entreprise et de prendre des décisions basées sur les analyses data.

 

Accélérez le travail de vos data scientists grâce à une solution de gestion des métadonnées

La gestion des métadonnées est une discipline essentielle pour les entreprises qui souhaitent soutenir l’innovation ou les initiatives de conformité réglementaire sur leur patrimoine de données. En mettant en œuvre une stratégie de metadata management, dans laquelle les métadonnées sont bien gérées et correctement documentées, les data scientists sont en mesure de facilement trouver et extraire des informations pertinentes à partir d’une plateforme intuitive. En leur fournissant les bons outils, vos équipes de data science seront capables de créer de nouveaux algorithmes de machine learning pour leurs projets data et donc, de produire de la valeur pour votre entreprise.

Découvrez nos conseils pour commencer une gestion des métadonnées en seulement 6 semaines en téléchargeant notre nouveau livre blanc « Le guide du metadata management ».

← Previous post Next post →

Business glossary : une solution essentielle pour vos data scientists

Business glossary : une solution essentielle pour vos data scientists

par Zeenea Software | Mai 26, 2020 | Metadata Management

Dans le monde de la data, un business glossary est un texte sacré qui représente de longues heures de travail et de collaboration entre les fonctions informatiques et métiers. Dans la gestion des métadonnées, un business glossary est un élément crucial pour contextualiser et définir ses données. Selon Gartner, c’est l’une des solutions les plus importantes à mettre en place dans une entreprise pour soutenir les objectifs commerciaux.

Pour aider vos data scientists avec leurs algorithmes de machine learning et leurs initiatives data, un business glossary fournit des significations et contextes clairs pour toute donnée ou tout terme business de l’entreprise.

Retour aux fondamentaux : qu’est-ce qu’un business glossary ?

Un business glossary apporte une signification et un contexte aux données dans tous les départements de l’entreprise. C’est donc un endroit où les termes métier / data sont définis et liés. Cela peut sembler simple, mais il est rare que tous les employés d’une entreprise partagent une même compréhension sur des termes – mêmes les plus fondamentaux – tels que «contact» et «client» au sein de l’entreprise.

Ses principaux objectifs, entre autres, sont les suivants :

  • Aligner l’ensemble des collaborateurs sur une même définition en créant un langage commun dans l’organisation.
  • Favoriser une meilleure compréhension et collaboration entre des équipes business & IT.
  • Associer des termes business à d’autres actifs d’entreprise et offrir une vue sur leurs différentes relations.
  • Élaborer et partager un ensemble de règles sur le domaine de la gouvernance des données.

Les organisations peuvent donc devenir data fluent !

Comment un business glossary est-il utile pour vos data scientists ?

En centralisant les informations business, les entreprises sont capables de partager la connaissance – qui était gardée par un groupe de sachants et d’experts – autour de leurs données. En effet, cela permet aux data scientists de prendre de meilleures décisions lors de leurs recherche de jeux de données à utiliser pour leurs usages. Cela permet également :

De devenir “data literate”

De plus en plus d’organismes, comme Forbes ou Gartner, considèrent que les entreprises doivent plus investir dans des moyens favorisant la compréhension des données. Ces programmes sont communément appelés en anglais “data literacy”.

Dans le cadre de la description du poste du Chief Data Officer, il est essentiel que toutes les parties de l’organisation puissent comprendre les données et le jargon associé. Cela permet à toutes les parties de l’organisation de mieux comprendre la signification, le contexte et les usages des données. Ainsi, en mettant en place un business glossary, les data scientists sont en mesure de collaborer avec tous les départements de l’entreprise, qu’ils soient informatiques ou business. Il y a moins d’erreurs de communication et ils participent donc à la construction et à l’amélioration de la connaissance sur les données de l’entreprise.

D’accéder à un environnement data-driven

Liée à la data literacy, la culture des données fait référence à un environnement de travail où les décisions sont prises sur une base de données empiriques et de preuves solides. En d’autres termes, les décisions sont basées sur des preuves data, plutôt que sur l’instinct seulement.

Un business glossary favorise la sensibilisation à la qualité des données et leurs compréhension globale. En conséquence, l’environnement devient plus data-driven et peut aider les data scientists à mieux connaître leurs données.

Plus de confiance aux données

Un business glossary garantit que les bonnes définitions soient liées aux bonnes données. Il aide à résoudre les problèmes généraux lorsque des incompréhensions sur les données sont identifiés. Lorsque tous les jeux de données sont correctement documentés avec une terminologie correcte et comprise par tous, il augmente la confiance générale dans les données d’entreprise, permettant aux data scientists de travailler efficacement sur leurs projets data.

 

Mettre en place un business glossary avec Zeenea

Zeenea propose un business glossary dans son data catalog. Il se connecte automatiquement et importe vos glossaires et dictionnaires dans notre outil grâce à nos API. Vous pouvez également manuellement créer un glossaire depuis l’interface de Zeenea !

Découvrez les avantages de notre business glossary pour vos data scientists !

Contactez-nous
← Previous post Next post →

Culture des données : les 5 priorités

Culture des données : les 5 priorités

par Zeenea Software | Mai 19, 2020 | Metadata Management

La data est devenue un actif stratégique pour les entreprises souhaitant innover et avoir un avantage concurrentiel. Dans l’espoir de satisfaire leurs clients, les entreprises ont, depuis plusieurs années, investi dans de multiples technologies et talents analytiques. Pourtant, pour beaucoup, une culture data driven reste inaccessible, et les données sont rarement utilisées comme base de décision.

La raison est simple : les challenges pour les entreprises qui souhaitent devenir data driven ne sont pas techniques, mais plutôt culturels. Il est bien plus facile d’expliquer comment insérer les données d’entreprise dans les processus décisionnels que de changer la mentalité de toute une organisation ! Dans cet article, nous décrivons cinq façons d’aider les entreprises à créer et à maintenir une culture des données.

D’ici 2023, la culture des données deviendra nécessaire pour produire de la valeur business, comme le démontre son inclusion formelle dans plus de 80 % des stratégies de données et d’analyse, et des programmes de gestion du changement.

Qu’est-ce que la culture des données ?

La “culture des données » est un concept relativement nouveau mais qui est de plus en plus important à mettre en place, notamment pour les organisations qui développent leurs stratégies digitales et de data management. Tout comme la culture organisationnelle, la culture des données fait référence à un environnement de travail dans lequel les décisions sont prises avec des preuves data dites “solides”, et non pas uniquement sur l’instinct.

La culture des données confère plus de pouvoir aux organisations pour organiser, exploiter, prévoir et créer de la valeur avec leurs data.

>> Regarder en Replay notre webinar : Why does data culture matter [EN] <<

 

Voici nos cinq conseils pour créer et maintenir une culture des données :

  

Étape 1 : Être aligné avec les objectifs de l’entreprise

L’objectif fondamental de la collecte, de l’analyse et du déploiement des données est de prendre de meilleures décisions ». (McKinsley)

Avoir confiance en ses données est un des éléments les plus importants pour créer une culture des données, car la méfiance à leur égard entraîne une culture organisationnelle désastreuse. Pour faire confiance aux données, il faut que celles-ci soient alignées avec les objectifs de l’entreprise. Pour favoriser les changements stratégiques et culturels, il est important que toute l’entreprise se mette d’accord sur des objectifs commerciaux communs, ainsi que sur les métriques pertinents pour mesurer les succès ou échecs dans l’ensemble de l’organisation.

Posez-vous les bonnes questions : Comment pouvons-nous, non seulement devancer nos concurrents, mais également maintenir notre avance ? De quelles données aurions-nous besoin pour décider de notre prochaine offre de produits ? Comment notre produit se comporte-t-il sur le marché ? En introduisant des données dans votre processus décisionnel, votre entreprise aura déjà fait le premier pas vers la création d’une culture des données.

Étape 2 : Détruire les silos de données

Les “silos de données” font référence aux départements, groupes ou individus qui sont les gardiens des données, mais qui ne partagent pas (ou ne savent pas comment partager) la connaissance des données avec d’autres parties de l’entreprise. Lorsque des informations cruciales sont enfermées et accessibles seulement à quelques connaisseurs, cela empêche votre entreprise de développer une culture de données interdépartementale. C’est également problématique d’un point de vue technique : les pipelines de données multiples sont plus difficiles à surveiller et à maintenir, ce qui fait que les données sont obsolètes au moment où quelqu’un les utilise pour prendre des décisions.

Pour briser les silos de données, les entreprises doivent mettre en place une source unique de vérité. Il faut donner aux employés les moyens de prendre des décisions fondées sur les données en s’appuyant sur une solution centralisée. Un data catalog permet aux utilisateurs techniques et non techniques de comprendre les actifs de données de l’entreprise et d’avoir confiance en eux.

>> Découvrez notre article: Qu’est-ce qu’un data catalog ? <<

Étape 3 : Embaucher des personnes data-driven

Lors de la mise en place d’une culture des données, il est important d’embaucher des personnes data-driven. Les entreprises se réorganisent, ce qui oblige à créer de nouveaux rôles pour soutenir ces changements organisationnels:

 

Data Stewards

Les Data Stewards orchestrent les systèmes de données d’une entreprise. Souvent appelés « maîtres des données », ils en ont des connaissances technique et business. Leur mission principale est d’assurer la bonne documentation des données et de faciliter leur accès pour leurs utilisateurs, tels que les data scientists ou les chefs de projet par exemple.

Cette profession est en plein essor ! Leur rôle collaboratif permet aux responsables de données de travailler à la fois avec les départements techniques et métiers. Ils sont le premier point de référence data dans l’entreprise et servent de point d’entrée pour y accéder.

 

Chief Data Officers

Les Chief Data Officers, ou CDO, jouent un rôle clé dans la stratégie de l’entreprise. Ils sont chargés d’améliorer l’efficacité globale de l’organisation et de créer de la valeur autour de leurs données. Initialement, les CDO avaient pour mission de convaincre les organisations d’exploiter leurs données. Les premières années ont généralement été soutenues par la construction d’un univers de données adapté aux nouveaux usages, souvent sous la forme d’un Data Lake ou d’un Data Mart. Mais avec le développement exponentiel des données, le rôle du CDO a pris une nouvelle ampleur. Désormais, les CDO doivent reconsidérer l’organisation de manière transversale et globale. Ils doivent devenir les nouveaux leaders de la Data Democracy !

Afin d’obtenir le soutien de tous les employés dans leurs initiatives data, ils doivent non seulement les aider à comprendre les données (contexte, production, etc.) mais également à investir dans la stratégie de production et l’exploitation des données.

 

Étape 4 : ne pas négliger ses métadonnées

Lorsque les données sont créées, les métadonnées (leur origine, leur format, leur type, etc.) le sont également. Cependant, ce type d’information ne suffit pas pour gérer correctement les données ; les leaders de la donnée doivent investir du temps pour s’assurer que ces informations soient correctement nommées, étiquetées, stockées et archivées dans une taxonomie qui est cohérente avec tous les autres actifs de l’entreprise.

Ces métadonnées permettent aux entreprises d’assurer une meilleure qualité et découverte des données, permettant aux équipes de mieux les comprendre. Sans métadonnées, les entreprises se retrouvent avec des jeux de données sans contexte qui ont peu de valeur.

 

Étape 5 : Respecter les différentes réglementations sur les données

Avec la mise en place du GDPR en mai 2018 ainsi que toutes les autres réglementations diverses qui voient le jour aux États-Unis, au Royaume-Uni ou même au Japon, il est important que les entreprises respectent et suivent les lignes directrices pour se conformer à celles-ci.

Si vous n’êtes pas sûr d’être conforme, consultez nos articles sur le RGPD <<

La mise en œuvre de la gouvernance des données est un moyen de garantir la confidentialité et la sécurité de toutes les données personnelles et d’assurer la gestion des risques. Il s’agit d’un ensemble de pratiques, de politiques, de normes et de guides qui fournissent une base solide pour garantir que les données sont correctement gérées, créant ainsi de la valeur au sein d’une organisation.

 

Étape 6 BONUS : Choisir les bonnes solutions

La gestion des métadonnées est une discipline en plein essor, nécessaire pour les entreprises qui souhaitent soutenir l’innovation ou les initiatives de conformité réglementaire sur leurs actifs de données. Une solution de gestion des métadonnées offre aux entreprises une plateforme centralisée permettant à tous les utilisateurs de données de mettre en œuvre une culture de données.

Pour plus d’informations sur le metadata management, contactez-nous !

Contactez-nous
← Previous post Next post →
Développez une culture data dans votre organisation avec une solution de gestion des métadonnées

Développez une culture data dans votre organisation avec une solution de gestion des métadonnées

par Zeenea Software | Mai 5, 2020 | Metadata Management

Afin d’optimiser leurs stratégies d’entreprise et d’améliorer leur productivité, les organisations data-driven changent la manière dont elles gèrent leurs données : elles passent d’une stratégie de data management, à une stratégie de metadata management. Néanmoins, Gartner affirme que seulement 5 à 20 % des entreprises sont équipées de solutions de gestion des métadonnées ! Cette discipline, au niveau de l’entreprise, est donc une pratique essentielle qui continuera à se développer dans les prochaines années :

”D’ici 2023, 80 % des organisations auront besoin de solutions qui répondent aux besoins et aux cas d’usage de leur utilisateurs business ». – Gartner.

Les challenges des solutions de metadata management selon les entreprises

Nous remarquons que les solutions actuelles sur le marché ne répondent pas entièrement aux demandes des entreprises. Nous remarquons :

  • Une faible d’adoption aux nouvelles solutions de gestion des métadonnées,
  • Un manque de confiance dans les données analysées,
  • Une incapacité à trouver des données dans l’écosystème data de l’organisation,
  • Des solutions conçues pour un utilisateur technique et non pour un utilisateur métier.

Ces conclusions, faites par diverses entreprises, peuvent s’avérer être assez sanglantes ! En visant la mise en place d’une culture démocratique des données, les entreprises se retrouvent avec des outils très techniques destinés au utilisateurs techniques, souvent abandonnés ou mal compris par l’entreprise de manière générale. Cette approche technologique de la gestion des métadonnées conduit à un manque de data literacy !

Pourtant, si les entreprises cherchent à mettre en œuvre des solutions de metadata management, c’est qu’elles ont déjà réalisé la valeur de celles-ci. Le problème n’est donc pas la discipline en elle-même, mais plutôt l’insatisfaction face à l’outil choisi et ses caractéristiques.

 

Les six éléments à prendre en compte lors du choix d’une solution de gestion des métadonnées

Initialement, les solutions de gestion des métadonnées avaient pour objectif d’aider les utilisateurs techniques à mieux comprendre leurs données. Cependant, au fil du temps, d’autres fonctions de l’entreprise se sont mises à consommer ou travailler avec les données et les métadonnées. Parmi ces utilisateurs, nous retrouvons des data stewards, des data analysts, des business analysts, des data scientists, des data architects et des data engineers.

Voici six éléments essentiels quant à l’adoption d’une stratégie de gestion des métadonnées à long terme :

 

Une expérience utilisateur personnalisée

Comme mentionné ci-dessus, les solutions de metadata management doivent avoir des caractéristiques et des fonctionnalités qui soutiennent les objectifs d’une mise en place de culture des données. La mise en place d’un moteur de recherche Googlesque est très efficace ! Les utilisateurs data sont en mesure de trouver des informations pertinentes en tapant des mots ou phrases clés. Les menus d’aide, les “drag & drop” et les wizards sont également d’autres exemples pertinents.

Les solutions de gestion des métadonnées qui incluent l’intelligence artificielle et des fonctions de machine learning permettent des expériences utilisateurs plus personnalisées. Comme les informations demandées et consultées varient d’une personne à l’autre, il est important qu’une solution de metadata management offre des interfaces adaptatives et personnalisées en fonction de leurs cas d’usage. Ces informations doivent être affichées avec des représentations visuelles faciles et attrayantes afin d’éviter de passer trop de temps à essayer de les comprendre.

 

Rôle et soutien à l’accès

Aujourd’hui, les utilisateurs data changent souvent de rôle et les entreprises passent la plupart de leur temps à reconfigurer qui a accès à quoi. Adopter une solution de gestion des métadonnées signifie être capable de configurer et de définir facilement les rôles et les modes d’édition au sein de la plateforme.

Cela permet d’avoir une vue d’ensemble de tous les utilisateurs : qui sont les responsables de données ? Qui sont les utilisateurs de données sur le projet X ? Qui est le propriétaire de ce jeu de données afin que je puisse demander la permission d’accéder à ces informations ? Qui a mis à jour ce jeu de données et quand ? Une meilleure visibilité sur les rôles et des accès est essentielle pour réussir sa stratégie de gestion des métadonnées.

Rapports & analyses

L’un des facteurs déterminants pour les organisations qui recherchent des solutions de gestion des métadonnées est la nécessité d’obtenir des résultats fiables du flux de données et des analyses. Ces solutions doivent être dotées de tableaux de bord pertinents et compréhensibles pour les utilisateurs, associés à leurs cas d’utilisation.

Soutenues par un data catalog, ces fonctionnalités de reporting permettent de savoir si une solution est intéressante pour l’entreprise. Un data catalog indique le volume de données collectées, le nombre d’utilisateurs, la fréquence à laquelle les utilisateurs se connectent, le nombre de fois qu’un jeu de données a été consulté ou même les questions fréquemment posées. Il peut également fournir des informations concernant la documentation des données, par exemple le niveau de complétion, si elle contient des informations personnelles, etc.

 

Un business glossary

Comme mentionné ci-dessus, les solutions de gestion des métadonnées devraient permettre aux utilisateurs business d’accéder à du contenu en rapport avec leurs cas d’utilisation. Cela peut être créé / intégré par des champs et tags qu’ils peuvent créer eux-mêmes, plutôt que d’adhérer à une taxonomie et à une sémantique d’un outil.

Les fonctionnalités d’un business glossary doivent fournir des modèles personnalisés et modulaires lors de la création de business termes et de taxonomies. Les wikis et les articles dans l’outil ne sont pas suffisant ! Un business glossary permet aux responsables des données de créer et de gérer un vocabulaire business commun et de le rendre disponible à l’ensemble de l’organisation.

 

Respect des réglementations data

La gouvernance et la conformité en général, sont les principaux moteurs d’adoption de solutions de gestion des métadonnées. Lorsque vous choisissez une plateforme de metadata management, si votre principal cas d’utilisation est la gouvernance des données, il est important de rechercher des solutions qui offrent des capacités automatisées concernant les informations personnelles de votre entreprise. Les notifications automatisées et les technologies de fingerprinting sont essentielles pour une meilleure gouvernance des données.

Capacités de collaboration

Les fonctionnalités sociales sont un must pour les entreprises qui cherchent à gérer leurs métadonnées ! Les discussions, évaluations, notes, popularité, notifications et les capacités de messagerie sont des éléments importants à avoir. Par exemple, les fonctionnalités sociales permettent aux utilisateurs de communiquer facilement avec les responsables ou experts d’un jeu de données ou projet.

En outre, l’intelligence collective permet aux entreprises de démocratiser l’accès aux informations et aux connaissances pour toute l’organisation. Grâce aux fonctionnalités de collaboration, les entreprises sont en mesure “d’archiver » les connaissances passées en les stockant. Les entreprises créent ainsi des communautés data et une organisation plus data fluent !

Démarrez une gestion des métadonnées en seulement 6 semaines !

En ce qui concerne la gestion des métadonnées, nous sommes les experts ! Dans ce livre blanc, nous partageons nos conseils et notre expertise sur la mise en œuvre d’une gestion itérative des métadonnées optimisée pour votre contexte.

Télécharger le livre blanc
← Previous post Next post →

WhereHows : la solution de data discovery et lineage de LinkedIn

WhereHows : la solution de data discovery et lineage de LinkedIn

par Zeenea Software | Avr 20, 2020 | Inspiration Data, Metadata Management

Dans un monde où le paysage des données se développe rapidement et où les SI sont de plus en plus complexes, les organisations de tous les secteurs ont compris l’importance de faciliter la découverte, la compréhension et la confiance dans leurs données.

Leurs armes ? Les métadonnées.

Que votre entreprise soit dans le secteur du streaming comme Spotify ou Netflix, dans le secteur du VTC comme Uber ou Lyft, ou même dans celui de la location saisonnière comme Airbnb, il est essentiel que les équipes data soient équipées des bons outils et bonnes solutions leur permettant d’innover et de produire de la valeur avec leurs données.

Dans cet article, nous nous concentrerons sur WhereHows, un projet open source dirigé par l’équipe data de LinkedIn. Ce projet a mené à la création d’un répertoire central pour les personnes, processus et connaissances data de l’entreprise. Avec plus de 50 000 jeux de données, 14 000 commentaires et 35 millions de jobs et d’informations sur le lineage, il est clair que la solution de data discovery de LinkedIn est un succès !

 

Les chiffres clés de Linkedin

Fondée par Reid Hoffman, Allen Blue, Konstantin Guericke, Eric Ly et Jean-Luc Vaillant en 2003 en Californie, la firme démarre son aventure assez lentement. En 2007, elle est enfin devenue rentable et, en 2011, elle comptait plus de 100 millions de membres dans le monde entier.

En 2020, Linkedin a connu une croissance significative:

  • Plus de 660 millions de membres LinkedIn dans le monde, dont 206 millions d’utilisateurs actifs en Europe,
  • Plus de 80 millions d’utilisateurs sur Linkedin Slideshare,
  • Plus de 9 milliards d’impressions de contenu,
  • 30 millions d’entreprises enregistrées dans le monde entier.

LinkedIn est devenu un réseau social professionnel incontournable pour les recruteurs, les spécialistes du marketing et les commerciaux. Alors, comment le Géant du web gère-t-il toutes ses informations ?

Le début de WhereHows

Comme la plupart des entreprises ayant un écosystème BI mature, Linkedin a commencé avec une équipe data warehouse, chargée d’intégrer les sources de données considérées comme les plus importantes. Cependant, le nombre de jeux de données et d’informations collectées data ne cessaient d’augmenter ! L’équipe de la firme a finit par se sentir très vite dépassée par la quantité colossale de données à gérer chaque jour.

Certaines questions revenaient inlassablement :

      • Qui est le propriétaire de ce flux de données ?
      • Comment ces données sont-elles arrivées ici ?
      • Où se trouvent les données ?
      • Quelles sont les données utilisées ?

Linkedin a donc décidé de développer une plateforme de métadonnées connectée à tous leurs systèmes d’information. La solution veut simplifier la collecte et l’affichage des métadonnées dans le but de faciliter la découverte de données. Bienvenue WhereHows !

La plateforme WhereHows en bref

WhereHows s’intègre à tous les environnements data et en extrait les métadonnées.

Ensuite, il fait apparaître ces informations via deux interfaces différentes :

  1. Une application web qui permet la navigation, la recherche, la visualisation du lineage, les discussions et la collaboration,
  2. Un API qui permet l’automatisation d’autres processus de données et d’applications.

Cette plateforme permet à Linkedin de résoudre les problèmes liés au data lineage, la connaissance des propriétaires d’un jeu de données, et à la découverte des schémas, entre autres. Elle détecte les schémas en se basant sur du machine learning et l’association entre le business glossary et leurs jeux de données.

Le Géant du Web a également créé une communauté basée sur la participation et la collaboration, ce qui leur permet de maintenir la documentation de leurs données en encourageant les discussions entre propriétaires de jeux de données.

Il y a trois composants principaux de WhereHows:

 

  1. Un référentiel de données qui stocke toutes les métadonnées,
  2. Un serveur web qui fait apparaître les données via l’API ou l’interface utilisateur,
  3. Un serveur backend qui récupère les métadonnées d’autres sources d’information.

Quelles sont les métadonnées collectées par WhereHows ? 

La puissance de WhereHows provient des métadonnées qu’il collecte dans l’écosystème de données de Linkedin.

Il collecte les métadonnées suivantes:

  • Métadonnées opérationnelles, telles que les jobs, les flux, etc.
  • Informations sur le lineage, qui permettent de relier les jeux de données entre elles sur les jobs,
  • Informations cataloguées telles que l’emplacement d’un jeu de données, sa structure, sa propriété, sa date de création, etc.

 

Comment LinkedIn utilise ses métadonnées

WhereHows utilise un modèle universel qui permet aux équipes data de mieux exploiter la valeur de leurs données ; par exemple, en effectuant une recherche à travers la plateforme WhereHow en fonction des métadonnées indexées.

De plus, le data lineage fournit les informations qui les relient entre elles et permettent aux équipes data de remonter ces informations en amont et en aval. Avec un écosystème data complètement intégré dans WhereHows, Linkedin arrive à suivre le flux d’une donnée du début à la fin !

Comment LinkedIn collecte ses métadonnées

La méthode utilisée pour collecter les métadonnées dépend de la source. Par exemple, les jeux de données Hadoop ont des “scraper jobs” qui permettent de scanner les fichiers HDFS, de lire les métadonnées, puis de les stocker à nouveau dans WhereHow.

Pour les “task planners” tels que Azkaban, ils connectent leur data warehouse backend pour obtenir les métadonnées, les agréger, les transformer au format dont ils ont besoin, et ensuite les charger dans WhereHows.
Pour les informations du data lineage, ils analysent le log du MapReduce et le log d’exécution d’un planificateur, puis combinent ces informations pour finalement obtenir le lineage.

 

Quelle est la prochaine étape pour WhereHows ?

Aujourd’hui, WhereHows est activement utilisé chez Linkedin, non seulement comme un warehouse de métadonnées, mais aussi pour l’automatisation d’autres projets data telle que l’automatisation de la suppression de données personnelles. En 2016, ils se sont intégrés aux systèmes ci-dessous:

À l’avenir, les équipes data de Linkedin espèrent élargir leur couverture de métadonnées en intégrant davantage de systèmes tels que Kafka ou Samza. Elles prévoient également de s’intégrer à des systèmes de gestion du cycle de vie des données et d’approvisionnement comme Nuage ou Goblin pour enrichir les métadonnées. WhereHows n’a pas dit son dernier mot !

Sources: 

  • 50 of the Most Important LinkedIn Stats for 2020: https://influencermarketinghub.com/linkedin-stats/
  • Open Sourcing WhereHows: A Data Discovery and Lineage Portal:
    https://engineering.linkedin.com/blog/2016/03/open-sourcing-wherehows–a-data-discovery-and-lineage-portal

Vous voulez en savoir plus sur les solutions de data discovery ?

Téléchargez notre livre blanc : « Le Data Discovery vu par les Géants du Web »

Dans ce livre blanc, nous faisons un focus sur le contexte et la mise en œuvre des solutions de data discovery développées par les grandes entreprises du web, dont certaines font partie du célèbre «Big Five» ou «GAFAM» (Google, Apple, Facebook, Amazon, Microsoft).

data-discovery-mockup-FR-no-shadow
télécharger le livre blanc
← Previous post Next post →

Data management : ne laissez pas vos métadonnées de côté

Data management : ne laissez pas vos métadonnées de côté

par Zeenea Software | Avr 15, 2020 | Metadata Management

Le data management peut être défini comme le processus d’ingestion, de stockage, d’organisation et de maintenance des données créées et collectées par une organisation en vue d’orienter les stratégies et les prises de décision de manière éclairée.

Nous ne vous apprendrons pas que les sujets data ne cessent d’évoluer et de se complexifier au sein des organisations ! Ainsi, toute entreprise qui envisage ces initiatives data et analytiques à grande échelle, se voit de plus en plus confrontée à des données au volume important, des types divers, des formats variés, et des environnements distribués.

Pour tenter d’en maximiser la valeur, les métadonnées sont une réponse permettant de  fournir des connaissances sur l’endroit où se trouvent les données, les attributs qu’ils possèdent ou encore la manière dont ils sont liés (également appelé knowledge graph).

Pourtant, la plupart des entreprises n’ont pas encore d’approche formelle de la gestion des métadonnées. 

Avec cet article, laissez vous convaincre par sa nécessité…

 

L’enjeu des métadonnées dans un data management d’avenir

À travers un contexte technologique de plus en plus éparse et complexe, les Responsables des données ou Chief data officers ont pour mission de simplifier et fournir un environnement data cohérent et activable par leurs équipes. 

Chez nos clients ayant fait le pari d’initier une gestion des métadonnées, nous constatons un objectif commun : assurer la visibilité des différentes sources et initiatives en matière de données et faire participer de nouveaux acteurs n’ayant pas forcément de profils techniques.

En bref, la nécessité d’aligner une sémantique sur de multiples silos de données est à l’origine de la demande accrue de capacité à gouverner les métadonnées. 

Voyez en cette nouvelle discipline de data management, un levier pour mieux décrire vos données, inclure des informations de localisation nécessaires pour leur utilisation ou/et leur protection dans des environnements et sources disparates. 

Voici un extrait des interrogations auxquelles vos métadonnées pourront répondre :

  • Qui a créé ces données ?
  • Qui est responsable de ces données ?
  • Dans quelles applications sont-elles utilisées ?
  • Quel est le niveau de fiabilité (qualité, vitesse, etc.) de ces données ?
  • Quels sont les contextes d’utilisation autorisés (concernant la confidentialité par exemple) ?
  • Où se trouvent ces données ?
  • D’où proviennent ces données ? (un partenaire, des données ouvertes, en interne etc.)

 

Créez un template de metamodel !

Dans ce toolkit, nous mettons en avant un ensemble de questions auxquelles vous serez à même de répondre via les métadonnées collectées depuis vos systèmes et vos propres connaissances.

Télécharger

Nos recommandations aux partie prenantes du data management

Pour celles et ceux qui abordent aujourd’hui la gestion des métadonnées dans le cadre de stratégies de data management, nous conseillons de :

  • Déployer de manière progressive un catalogue de données (ou data catalog) d’entreprise en adoptant des pratiques de gestion des métadonnées. L’utilisation de data catalog servira, entre autre, à inventorier toutes formes de métadonnées techniques mais également de plus en plus business, opérationnelles et sociales – afin d’améliorer la visibilité des activités de data management.

  • Travailler avec des fournisseurs capables d’accepter cette diversité dans leur système et d’opérer dans des infrastructures de data management distribués, indépendants et allant de plus en plus vers le cloud.

  • Identifier des cas d’utilisation de metadata management facilement activables afin d’en prouver sa valeur rapidement. Les fournisseurs de solutions retenus devront être ceux favorisant l’automatisation de la découverte, le profilage et l’inventaire des métadonnées ou à minima des tâches les plus fastidieuses ou routinières.

Pour allez plus loin, téléchargez notre guide de metadata management!

Il vous guidera dans la mise en place d’une stratégie de metadata management en seulement 6 semaines.

Télécharger
← Previous post Next post →

Comment démarrer une gestion des métadonnées ?

Comment démarrer une gestion des métadonnées ?

par Zeenea Software | Avr 10, 2020 | Metadata Management

La gestion des métadonnées est une discipline naissante et nécessaire pour les entreprises souhaitant renforcer des démarches d’innovation ou de conformité réglementaire sur leur patrimoine de données.

Nombre d’entre elles essaient d’acquérir des convictions sur le sujet et de se doter de solutions permettant de relever ce nouveau pari. En conséquence, les métadonnées se voient de plus en plus administrées, en parallèle des données, de manière cloisonnée et silotée, ne permettant pas d’actionner tout le potentiel de cette discipline à l’échelle de l’entreprise.

 

  1. Quelles sont les conditions de succès pour démarrer un metadata management ?
  2. Comment gérer ses métadonnées ?
  3. Comment démarrer une gestion des métadonnées ?

Pour valoriser cette “nouvelle” discipline dans votre organisation, vous devez démontrer sa capacité à produire de la valeur dès son démarrage ! Chez Zeenea, nous proposons un accompagnement fort supporté par un data catalog afin de produire de la valeur dans un temps très court, de l’ordre de quelques semaines dans la plupart des cas.

Dans cet article, nous vous livrons une démarche facilitée par une solution comme Zeenea : connectée, agile et agnostique quant aux technologies utilisées dans les entreprises.

Centraliser vos efforts

Contrôlez que les efforts effectués en termes de métadonnées ne soient pas isolés mais bien centralisés et unifiés.

De cette manière vous éviterez de reproduire des silos d’informations de la même manière que les données ont été silotées par le passé.

Définir un jalon

Pour chaque jalon, vous serez amenés à identifier plusieurs éléments : 

 

    • Quels sont les problèmes : L’augmentation et le partage du savoir doit permettre de résoudre un problème. Il peut être de natures diverses : conformité pour un audit programmé, centralisation et l’uniformisation d’une information particulière pour satisfaire un groupe de collaborateurs en difficulté par exemple.
    • Quels sont mes données : Il est important de concentrer les efforts sur les données en lien direct avec le problème identifié. Vouloir traiter un ensemble trop large va accroître le délai de réalisation et in fine le moment où l’atteinte de l’objectif, et donc la production de valeur, pourra être mesurée.
    • Qui sont mes utilisateurs de la donnée : Sur la première itération, peut être plus longue que toute autre, les utilisateurs mobilisés seront structurants. Ils doivent pouvoir dégager suffisamment de temps pour s’investir dans la réalisation de l’objectif, mais ils doivent aussi avoir intégré la motivation à mettre en place une gestion des métadonnées. Ces utilisateurs seront vos premiers ambassadeurs par la suite. 
    • Quel est la temporalité : Cette itération doit être réalisée dans un délai raisonnablement court. À l’échelle de l’entreprise, nous recommandons un délai compris entre 4 semaines à 3 mois maximum, en fonction de la bande passante des personnes en charge du sujet. Cette durée doit aussi aider à qualifier si un problème est adapté ou bien doit être subdivisé, ou tout simplement écarté.

Il arrive, avant même que le premier jalon soit identifié, qu’un exercice préalable d’introspection sur la maturité de l’entreprise en matière de gouvernance des données soit réalisé.

Nous proposons ceci au travers d’ateliers au cours desquels l’entreprise, aidée par notre matrice de maturité, pourra définir son positionnement. Ce type d’exercice présente un intérêt assez notable lorsqu’il est régulièrement (par exemple chaque année) réalisé. Il permet d’apprécier de façon globale les bénéfices du déploiement de votre programme de gouvernance.

Lancer le premier jalon

Assez classiquement, la proposition de séquencement concernant la phase d’onboarding soutenue par notre outil de metadata management suit cette chronologie :

Notre volonté est d’ancrer le démarrage dans un réflexe de production de valeur. Chaque itération doit apporter à l’entreprise des bénéfices tangibles à votre problématique. Cette première itération comporte des éléments qui n’apparaîtront plus, ou à minima beaucoup moins, dans les suivantes, en particulier les aspects techniques liés à la mise en place de la solution.

Nous proposons par défaut des itérations de 6 semaines. Cette durée, assez arbitraire, correspond relativement bien au temps généralement nécessaire pour produire une valeur significative tout en ne perturbant pas trop l’activité des personnes impliquées. Il faut en effet garder à l’esprit que rares sont les cas où les collaborateurs mobilisés disposent d’un temps complet pour traiter du sujet.

Démarrer votre gestion des métadonnées avec notre guide

Souhaitez vous avoir plus de détails sur comment démarrer votre projet de gestion des métadonnées ?

Téléchargez notre guide pour lancer une gestion efficace des métadonnées !

TÉLÉCHARGER
← Previous post Next post →

Comment gérer ses métadonnées ?

Comment gérer ses métadonnées ?

par Zeenea Software | Avr 10, 2020 | Metadata Management

La gestion des métadonnées est une discipline naissante et nécessaire pour les entreprises souhaitant renforcer des démarches d’innovation ou de conformité réglementaire sur leur patrimoine de données.

Nombre d’entre elles essaient d’acquérir des convictions sur le sujet et de se doter de solutions permettant de relever ce nouveau pari. En conséquence, les métadonnées se voient de plus en plus administrées, en parallèle des données, de manière cloisonnée et silotée, ne permettant pas d’actionner tout le potentiel de cette discipline à l’échelle de l’entreprise.

 

  1. Quelles sont les conditions de succès pour démarrer un metadata management ?
  2. Comment gérer ses métadonnées ?
  3. Comment démarrer une gestion des métadonnées ?

Votre organisation souhaite développer des pratiques de gestion des métadonnées ? Le metadata management est essentiel afin de répondre aux exigences croissantes liées à la gouvernance des données, au risque et à la conformité des données, ou encore à l’analyse des données et à sa génération de valeur.

Pour soutenir cette discipline, vous serez amenés à choisir une plateforme de metadata management. Pour faire simple, ces solutions doivent permettre aux responsables des données de capturer, stocker et agréger les métadonnées du SI de l’entreprise dans une même plateforme.

Vous vous rendrez très vite compte que le marché est complexe : les solutions sont diverses et leur portée ou capacité plus ou moins limitées.

Prenez un temps pour valider les capacités fonctionnelles de votre solution de gestion de métadonnées pour vous aider à :

Centraliser vos efforts

Contrôlez que les efforts effectués en termes de métadonnées ne soient pas isolés mais bien centralisés et unifiés.

De cette manière vous éviterez de reproduire des silos d’informations de la même manière que les données ont été silotées par le passé.

Partir de l’existant

Nous croyons qu’une stratégie de metadata management durable dans le temps ne peut être descriptive. Recherchez une solution qui saura se connecter à vos bases de données et automatiser l’import et la mise à jour de métadonnées techniques et opérationnelles (la source d’un jeu de données, son schéma, sa dernière mise à jour, etc.) dans la plateforme.

En étant connecté à la réalité opérationnelle de votre SI, la plateforme s’assure ainsi de gérer et proposer des informations avérées et non obsolètes à vos consommateurs de données.

Correspondre à votre contexte

Nous sommes convaincus que ce n’est pas à l’entreprise de se plier au modèle de documentation de la solution mais bien l’inverse !

En adoptant une solution modulaire et personnalisable, vous pourrez ajuster, prioriser et ajouter les éléments manquants et nécessaires pour vos consommateurs de données. À partir de cette approche, avancez pas à pas vers une gouvernance de métadonnées incrémentale et itérative correspondant à votre contexte selon vos priorités.

Prenez donc un temps pour recueillir les besoins et les difficultés de vos utilisateurs et consommateurs de données. Puis, constituez un template de documentation pertinent pour vos consommateurs qui orientera vos efforts quant à la collecte de métadonnées.

Avancer vite (et bien !)

Nous considérons l’automatisation de l’ingestion et l’intelligence de la solution comme les facteurs clés de succès !

Ces capacités permettront d’automatiser les tâches les plus fastidieuses, proposer des synergies dans votre patrimoine de données afin de documenter et contextualiser toujours plus et mieux vos données.

Sous le prisme réglementaire, par exemple, une plateforme intelligente pourra identifier par sa documentation déjà existante quels jeux de données sont considérés comme “sensibles” et contenant des données personnelles.

Explorer ses métadonnées

L’agrégation de métadonnées du SI dans une plateforme n’a de sens que si elles sont partagées au sein de l’entreprise et facilement accessibles par vos consommateurs de données. Les data catalogs répondent à ce premier cas d’usage :

Permettre aux analystes, aux data scientists et à tous autres consommateurs de données de trouver et de comprendre le patrimoine de données d’une entreprise dans le but d’en extraire de la valeur

Démarrez une gestion des métadonnées en seulement 6 semaines

Dans de nombreuses organisations, le metadata management est encore une tâche manuelle, très chronophage, effectuée par des profils plutôt techniques pour des profils techniques.

Par conséquent, la gestion des métadonnées en tant que discipline est passée inaperçue pour les parties prenantes des données et de l’analyse. La capacité des équipes à en expliquer les bénéfices ou à démontrer sa valeur a été et peut encore être difficile.

Téléchargez notre guide pour démarrer votre gestion des métadonnées ! Au travers de ce livre blanc, nous partageons nos conseils et expertises sur la mise en place d’une gestion des métadonnées itérative et optimisée pour votre contexte.

TÉLÉCHARGER
← Previous post Next post →

Quelles sont les conditions de succès pour démarrer un metadata management ?

Quelles sont les conditions de succès pour démarrer un metadata management ?

par Zeenea Software | Avr 10, 2020 | Metadata Management

La gestion des métadonnées est une discipline naissante et nécessaire pour les entreprises souhaitant renforcer des démarches d’innovation ou de conformité réglementaire sur leur patrimoine de données.

Nombre d’entre elles essaient d’acquérir des convictions sur le sujet et de se doter de solutions permettant de relever ce nouveau pari. En conséquence, les métadonnées se voient de plus en plus administrées, en parallèle des données, de manière cloisonnée et silotée, ne permettant pas d’actionner tout le potentiel de cette discipline à l’échelle de l’entreprise.

 

  1. Quelles sont les conditions de succès pour démarrer un metadata management ?
  2. Comment gérer ses métadonnées ?
  3. Comment démarrer une gestion des métadonnées ?

Avant d’enclencher votre projet de metadata management, nous vous conseillons de prendre un certain temps pour rassembler et étudier l’ensemble des éléments suivants:

Accepter d’échouer

Ce titre est volontairement fort ! Mais la peur n’évitant pas le danger, avoir conscience d’un risque et savoir l’intégrer dans la démarche est un élément crucial pour survivre à un incident de parcours. Être conscient du risque et savoir l’intégrer dans la démarche est un élément crucial du lancement d’une plateforme de gestion des métadonnées.

Accepter d’échouer, c’est donc admettre que la route ne sera pas pavée d’étapes simples et évidentes.

Mettre en place une gouvernance des données autour d’une gestion pertinente des métadonnées est un sujet complexe à l’échelle d’une entreprise, exacerbé par de nombreux facteurs : taille et complexité de l’organisation, culture ou sensibilité concernant le sujet de la donnée, prise en conscience des enjeux stratégiques associés, etc. Forcément, un sujet complexe induit un risque lors de l’exécution opérationnelle…

Expérimenter avec votre environnement data

Un metadata management se construit progressivement! Aucune révélation ne vienne frapper l’équipe en charge du projet à son initialisation. Il paraît évident que certaines décisions qui seront prises ne seront pas optimales et devront être revues, voire contredites. Seule l’expérimentation permettra de valider les effets attendus

Pour contrôler le coût induit par l’expérimentation, l’approche la plus évidente est de progresser par étape, de réduire unitairement le risque et de le rendre satisfaisant en cas d’ajustement nécessaire. Accepter d’échouer, ce n’est pas se résigner! Au contraire, c’est se mettre dans une posture où les efforts ne sont pas mis exclusivement sur l’anticipation mais aussi sur la remédiation et l’adaptation. Des hypothèses vont être validées successivement, en faisant varier un nombre de paramètres le plus limité possible à chaque fois, et les conclusions, par la mesure, permettront de progresser.

Ce fonctionnement est totalement itératif et incrémental. On retrouve donc des fondamentaux promus de façon assez générale par l’agilité.

S’aligner avec les objectifs d’entreprise

Les objectifs d’une gouvernance de vos métadonnées peuvent être locaux ou globaux.

La démarche peut ne concerner qu’un périmètre limité dans l’entreprise, et traduire une initiative très locale, tout comme à l’inverse, elle peut être vouée à s’appliquer à l’entreprise dans son ensemble. À plus forte raison lorsqu’ils sont globaux à l’entreprise, et donc souvent exprimés de façon assez généraliste, il est important de veiller à ce que leur implémentation reste en phase avec l’idée originelle.

Un élément important dans cette équation est donc la dimension humaine ! D’une part parce que des responsabilités seront identifiées, mais aussi parce que certains processus devront soit évoluer, soit être définis, ou encore parce que la culture et les à priori autour de la donnée devront être modifiés, à grand renfort de communication.

Malgré tout, s’adapter et en général, c’est une pratique salutaire.

Prioriser

Parmi les bénéfices d’une telle démarche, on trouve, comme cité précédemment, une meilleure maîtrise du risque. Mais il existe un autre bénéfice assez évident : la possibilité d’avoir un retour sur investissement plus rapide. Les premiers effets doivent pouvoir être constatés dès la fin de la première itération.

L’objectif doit être déterminé pour produire de la valeur concrète pour l’entreprise.

Sélectionner les informations utiles

Vouloir gouverner ses métadonnées, ce n’est pas construire un inventaire excessivement complet et complexe d’informations sur les données. Il s’agit d’identifier les informations utiles, et même prioritairement nécessaires.

Nous recommandons d’être sélectif sur la nature des informations caractérisant les données. La tentation d’un métamodèle trop ambitieux pourrait en effet nuire à l’effort qualitatif demandé aux profils Data Stewards.

Nous préconisons donc une sélection très précise des métadonnées répondant aux objectifs donnés par itération. L’organisation des connaissances dans un catalogue de métadonnées s’en trouvera optimisée, aussi bien pour les contributeurs que sont les Stewards, que les utilisateurs en quête d’informations.

La qualité doit primer sur la quantité, l’approche itérative répondra aux attentes d’enrichissement de façon progressive au fur et à mesure du déploiement.

Capitaliser sur ses métadonnées!

Votre expérimentation va se traduire par des initiatives locales qui pourront
donner lieu à des réflexions sur la généralisation de tout ou partie des
réalisations.

Capitaliser c’est savoir identifier ce qui relève de l’intérêt commun.

Démarrez une gestion des métadonnées en seulement 6 semaines

Dans de nombreuses organisations, le metadata management est encore une tâche manuelle, très chronophage, effectuée par des profils plutôt techniques pour des profils techniques.

Par conséquent, la gestion des métadonnées en tant que discipline est passée inaperçue pour les parties prenantes des données et de l’analyse. La capacité des équipes à en expliquer les bénéfices ou à démontrer sa valeur a été et peut encore être difficile.

Téléchargez notre guide pour démarrer votre gestion des métadonnées ! Au travers de ce livre blanc, nous partageons nos conseils et expertises sur la mise en place d’une gestion des métadonnées itérative et optimisée pour votre contexte.

TÉLÉCHARGER
← Previous post Next post →

Articles récents

  • L’IoT dans l’industrie : pourquoi votre entreprise a-t-elle besoin d’un catalogue de données
  • Nouvelle série de livres blancs : “Unlock Data” – quel que soit votre secteur d’activité
  • Total : la réussite de sa transformation digitale
  • Comment les données ont-elles impacté le secteur industriel ?
  • IMAgineDay : Zeenea présente sa solution innovante au Trophée Outillage IA et Data

Catégories

  • Actu & événements
  • Data Catalog
  • Gouvernance des données
  • Inspiration Data
  • Metadata Management
  • Produit Zeenea
  • RGPD