Quelle est la différence entre un Data Steward et un Data Owner ?

Quelle est la différence entre un Data Steward et un Data Owner ?

data-steward-vs-data-owner

Quelle est la différence entre des Data Stewards et des Data Owners ? Cette question revient inlassablement !

Vous pourrez sur la toile internet lire différentes définitions associées à la gestion des données et à leur gouvernance. De plus, selon les entreprises, leurs définitions et leurs responsabilités peuvent très largement varier. 

Pour tenter de clarifier la situation, nous proposons à travers cet article de faire un résumé de ces deux profils que nous avons pu rencontrer chez nos clients et d’établir une potentielle complémentarité.

Avant tout, nous croyons fermement qu’il n’existe pas de cadre idyllique ou standard et que ces définitions sont propres à chaque entreprise du fait de leur organisation et de leur “legacy”.

Data owner et data stewards : deux rôles aux maturités différentes

La nomination récente des CDOs a largement été guidée par les transformations digitales entreprises de ces dernières années : maîtriser le cycle de vie de la donnée de sa collecte à son création de valeur. Pour tenter d’y parvenir, un objectif simple – mais pourtant complexe – s’est dessiné : connaître en premier lieu le patrimoine informationnel de l’entreprise bien trop souvent siloté. 

Ainsi, la première étape de nombreux CDOs a été d’aller référencer ces actifs, de les documenter tant sur l’angle business, les traitements qui les ont transformés que les moyens techniques pour les exploiter.

Ce principe fondateur d’une gouvernance des données a également été évoqué par Christina Poirson, CDO du groupe Société Général lors d’une table ronde qui s’est déroulée au Big Data Paris 2020. Elle explique l’importance de connaître son environnement data ainsi que les risques associés pour in fine créer de la valeur.

Lors de son intervention, Christina Poirson a développé les rôles des Data Owners au sein de ce challenge du partage de la connaissance data. Intégrés au métier, ils ont la responsabilité de définir leurs jeux de données, leurs usages ainsi que la qualité associée, sans pour autant mettre en cause le Data Owner :

“la donnée chez nous appartient soit au client, ou à toute l’entreprise, mais pas à une BU ou un département particulier. On réussit à créer de la valeur à partir du moment où les données sont partagées”.  

Vous en conviendrez, les data owners sont des rôles présents depuis plus longtemps dans les organisations que les data stewards. Ce sont des parties prenantes de la collecte, l’accessibilité et la qualité de jeux de données. 

Nous qualifions le Data Owner comme le responsable de la donnée finale. Nous pouvons prendre l’exemple simple d’un directeur marketing, qui pourra entreprendre ce rôle dans la gestion des données clients. Il aura ainsi la responsabilité et le devoir d’en maîtriser sa collecte, sa protection et ses usages.

 La démocratisation des data stewards s’est faite plus récemment, jusqu’à créer des postes dédiés dans les organisations. À l’inverse d’un data owner, propriétaire et responsable de données, celui-ci intervient plus largement dans un challenge, qui re-gagne en popularité depuis quelques temps, la gouvernance des données.

Dans nos articles, “Qui sont les data stewards ?” ou encore “Les multiples facettes du stewards”, nous parlons plus en détails de ce profil impliqué dans le référencement, la documentation des actifs d’entreprise (nous parlons bien évidemment des données) pour en simplifier leur compréhension et leurs usages. 

Data Steward et Data Owner : deux rôles complémentaires ?

Dans les faits, les entreprises n’ont pas toujours les moyens d’ouvrir de nouveaux postes aux data stewards. Dans une organisation idéalisée, la complémentarité de ces profils pourrait tendre vers :  

Un data owner est responsable des données de son périmètre dans sa collecte, sa protection, et sa qualité. La suite serait alors prise par le data steward en charge de rédiger et agréger les informations, les définitions et tout autre besoin de l’entreprise pour simplifier la découverte et la compréhension de ces actifs.

Prenons l’exemple de la qualité d’un jeu de données. Si un problème de qualité des données subvient, il faudrait vous attendre à ce que le data steward souligne les problèmes rencontrés par ses consommateurs au Data Owner chargé alors d’enquêter et proposer les mesures correctives.

Pour illustrer cette complémentarité, Chafika Chettaoui, CDO chez Suez – également présente lors de la table ronde du Big Data Paris 2020 – confirme qu’ils ont ajouté un autre rôle dans leur organisation, celui du Data Steward. Chez eux, le Data Steward est la personne qui s’assure que le flux de données fonctionne. Elle explique :

“Le Data Steward est la personne qui va animer ce qu’on appelle les Data Producers (les personnes qui collectent les données dans les systèmes), s’assurer qu’ils soient bien formés et qu’ils comprennent la qualité et le contexte des données pour créer leurs dashboards de reporting et d’analyses. Pour résumer, c’est un profil métier, mais avec une vraie valence data et une compréhension de la donnée et de sa valeur”. 

Pour conclure, il existe en anglais, deux notions difficiles à traduire dans la langue française qui pourtant font une différence certaine entre ses deux rôles: le data owner est “accountable for data” tandis que le data stewards est “responsible for” l’activité de la donnée au jour le jour.

Comment déployer une gouvernance des données performante et adoptée par tous

Comment déployer une gouvernance des données performante et adoptée par tous

big-data-paris-table-ronde-CDO-1

Il est évident que la COVID-19 a bousculé l’économie et le monde du travail à travers le monde entier. En mars 2020, la France a été mise en confinement total, et de nombreuses entreprises ont dû s’adapter à de nouvelles manières de travailler, que ce soit à travers la mise en place du télétravail, des changements de rythmes de production, ou encore l’arrêt total du fonctionnement de l’organisation. Cette crise sanitaire a donc chamboulé les entreprises : comment faire face aux risques financiers, technologiques, et de conformité suite à la pandémie ?

Au Big Data Paris 2020, nous avons eu le plaisir d’assister à la table ronde “Comment déployer une gouvernance des données performante et adoptée par tous” animée par Christina Poirson, Groupe CDO de la Société Générale, Chafika Chettaoui, CDO du Groupe Suez et Elias Baltassis, Partner & Director, Data & Analytics du Boston Consulting Group. Dans cette table ronde d’environ 35 minutes, les trois experts data nous expliquent l’importance et les “best practices” de la mise en place d’une gouvernance des données. 

Les premières étapes pour implémenter une gouvernance des données

L’impact du COVID-19 n’a pas été sans souligner le défi essentiel de la connaissance, de la collecte, de la conservation et de la transmission de données de qualité. Donc, est-ce que le confinement a poussé les entreprises à vouloir mettre en place une stratégie de gouvernance des données ? Cette première question répondue par Elias Baltassis a confirmé la forte augmentation de demande de mise en place de gouvernance des données en France :

“le confinement a certainement accéléré la demande de mise en place de data governance ! La gouvernance des données était déjà un sujet pour la majorité de ces entreprises bien avant le confinement, mais la crise sanitaire a bien sûr poussé les entreprises à renforcer la sécurité et fiabilité de leur patrimoine de données.”

Mais donc, quel est l’objectif d’une gouvernance des données ? Et par où commencer ? Elias nous explique qu’il faut tout d’abord faire un diagnostique des actifs de données dans l’entreprise, et identifier les points de friction : “Identifiez les endroits dans l’entreprise où il y a une déperdition de valeur à cause de la mauvaise qualité des données. Ceci est important car la gouvernance des données peut facilement dériver vers un exercice bureaucratique, et c’est pour ça qu’il faut toujours garder comme “guide” la valeur créée pour l’organisation, qui se traduit par une meilleure accessibilité, meilleure qualité, etc”. 

Une fois que le diagnostique a été posé et que les sources de valeur sont identifiées, Elias nous explique qu’il y a quatre étapes de méthodologie à suivre :

  1. Connaître les données d’entreprise, leur structure, et à qui elles appartiennent  (via un glossaire de données par exemple),
  2. Mettre en place une politique de données ciblée sur les points de friction,
  3. Choisir le bon outil pour déployer ces politiques à travers l’entreprise
  4. Mettre en place une culture des données au sein de l’organisation en commençant par embaucher des personnes data-driven, telles que des Chief Data Officers. 

La méthodologie ci-dessus est donc primordiale avant de démarrer tout projet de gouvernance des données qui, selon Elias, peut se mettre en place assez rapidement : “la gouvernance des données peut être implémentée rapidement, par contre l’augmentation de la qualité des données va prendre plus ou moins de temps, ça dépend de la complexité de l’entreprise ; une entreprise qui travaille avec un seul pays prendra moins de temps qu’une entreprise travaillant avec toute l’Europe par exemple”. 

big-data-paris-table-ronde-CDO-3

Le rôle du Chief Data Officer dans la mise en place d’une gouvernance des données

Au tour de Christina Poirson, qui explique que pour elle et la Société Générale, la gouvernance des données a joué un rôle très important durant cette période exceptionnelle : “heureusement que nous avions mis en place une gouvernance des données qui a su assurer la qualité et la protection des données durant le confinement à nos clients professionnels et particuliers. Nous avons réalisé l’importance du couple digitalisation et data qui s’est montré vital pour non seulement notre travaille durant la crise, mais également pour les activités de demain”.  

Mais donc, comment est-ce qu’une entreprise aussi grande, ancienne et ayant des milliers de données comme la Société Générale a-t-elle pu mettre en place une nouvelle stratégie de data governance ? Christina nous explique que la donnée au sein de la Société Générale n’est pas un sujet récent. Effectivement, dès la naissance des premières agences, la firme a demandé des informations sur le client afin de pouvoir le conseiller sur quel type de prêt mettre en place par exemple. 

Cependant, la CDO de la Société Générale nous affirme qu’il y a aujourd’hui, avec la digitalisation, de nouveaux types, formats et volumes de données. Elle confirme ce qu’Elias Baltassis disait juste avant : “La mise en place d’un data office et de Chief Data Officers était une des premières étapes dans la stratégie data de l’entreprise. Notre rôle est de maximiser la valeur des données tout en respectant la protection des données sensibles, ce qui est très important dans le monde de la banque !”

Pour faire cela, Christina explique que la Société Générale accompagne cette stratégie tout au long du cycle de la donnée : de sa création jusqu’à sa fin de vie en passant par sa qualification, sa protection, son utilisation, son anonymisation et sa destruction.

De l’autre côté, Chafika Chettaoui, CDO du groupe Suez explique qu’elle se voit en chef d’orchestre :

“ce qui manquait à Suez c’était un chef d’orchestre qui doit organiser comment la technique peut répondre à un objectif métier. Aujourd’hui avec le nombre de données qui augmente, le CDO doit être le chef d’orchestre pour les départements IT, métier, et même ceux du RH et de la communication car la transformation data et digitale est surtout une transformation humaine. Il doit être l’organisateur afin d’assurer la qualité et l’accessibilité des données ainsi que leurs analyses.”

Mais surtout, les deux intervenantes sont d’accord pour dire qu’un CDO ont deux principales missions :

  • La mise en place de différentes normes sur la qualité et protection des données,
  • Doit casser les silos data en créant un langage commun autour de la data , ou la data fluency, dans toute partie de l’entreprise

L’acculturation des données dans l’entreprise

Nous n’avons pas besoin de vous rappeler que la mise en place d’une culture des données au sein de l’entreprise est essentielle pour créer de la valeur avec ses data. Christina Poirson explique que l’acculturation data a été assez longue pour la Société Générale : 

“Pour mettre en place une culture data, nous sommes passés par la cartographie des données à tous les niveaux des structures managériales, du top management au collaborateur. Nous avons également dû mettre en place des sessions de coaching, des formations de coding ou autres sensibilisations dédiées. Nous avons aussi mis à disposition tous les cas d’usage du groupe SG dans un catalogue d’idées qui sert à ce que chaque entreprise du groupe (quel que soit le pays) puisse être inspirée : c’est une bibliothèque de cas d’usage qui est là pour inspirer les gens.” 

Elle continue à expliquer qu’ils ont d’autres manières d’acculturer les employés à la Société Générale :

  • La mise en place de bibliothèque d’algorithmes pour réutiliser ce qui a déjà été mis en place
  • Mise en place d’outils spécifiques pour évaluer si la donnée est conforme aux réglementations
  • Rendre les données accessibles en passant par un catalogue de données du groupe

L’acculturation des données n’était donc pas un long fleuve tranquille pour la société générale. Mais, Christina reste positive et nous raconte une petite analogie :

“la data c’est comme l’eau, des DSI sont les tuyaux, et les métiers font des demandes liées à l’eau. Il doit donc avoir une symbiose entre la DSI, l’IT et les métiers”. 

Chafika Chettaoui ajoute : “Effectivement, il est impératif de travailler avec et pour le métier. Notre travail est de nommer des gens chez les métiers qui vont être responsable de leurs données.  Il faut redonner la responsabilité à chacun : l’IT pour la construction de la maison, et le métier pour ce qu’on met à l’intérieur. En mettant cet équilibre-là, il y a un vrai aller-retour et non pas juste l’IT qui est responsable de tout”.

big-data-paris-table-ronde-CDO-2

Les rôles dans la gouvernance des données

Bien que les rôles et responsabilités varient d’entreprise à entreprise, lors de cette table ronde, les deux Chief Data Officers nous expliquent comment fonctionne l’attribution des rôles au sein de leur stratégie data. 

À la Société Générale ils ont des convictions assez forte. Premièrement, ils mettent en place des “Data Owners”, qui font partie du métier, qui sont responsables de :

  • la définition de la donnée
  • les principaux usages
  • le niveau de qualité associé

Par contre, si un utilisateur data veut utiliser une donnée, il n’a pas à demander la permission du Data Owner, sinon ça crispe tout le système. De ce fait, la Société Générale met des dispositifs qui font qu’ils vérifient le respect des règles et réglementations, sans pour autant mettre en cause le Data Owner : “la donnée chez nous appartient soit au client, ou à toute l’entreprise, mais pas une BU ou département particulier. On réussit à créer de la valeur à partir du moment où les données sont partagées”.  

Chez Suez, Chafika Chettaoui confirme qu’ils ont la même définition du Data Owner, mais il ajoute un autre rôle, celui du Data Steward. À Suez, le Data Steward c’est celui qui est sur place, qui s’assure que le flux de données fonctionne. Elle explique : “Le Data Steward c’est quelqu’un qui va animer ce qu’on appelle les Data Producers (les personnes qui collectent les données dans les systèmes), s’assurer qu’ils soient bien formés et qu’ils comprennent la qualité des données, et celui qui vont tenir les dashboards de reporting et analyser s’il y a des incohérences. C’est quelqu’un du métier, mais avec une vraie valence data et une compréhension de la donnée ainsi que de sa valeur”. 

Quelles sont les bonnes pratiques essentielles pour la mise en place d’une gouvernance des données ?

Ce qu’il ne faut jamais oublier dans l’implémentation d’une gouvernance des données c’est de se rappeler qu’une donnée n’appartient pas à une seule partie de l’organisation mais doit être partagée. Il est donc impératif de normer la donnée. Pour cela, Christina Poirson nous explique l’importance d’un dictionnaire des données : “en ajoutant un dictionnaire des données incluant le nom, la définition, le data owner, et le niveau de qualité de la donnée, vous avez déjà une première brique dans votre gouvernance”. 

Comme mentionné ci-dessus, la deuxième bonne pratique de la data governance c’est de définir des rôles et responsabilités autour des données. En plus d’un Data Owner ou Data Steward, il est essentiel de définir une série de rôles pour accompagner à chaque étape clé de l’utilisation des données. Certains de ces rôles peuvent être :

  • Data Quality Manager
  • Data Protection Analyst
  • Data Usages Analyst 
  • Data Analyst
  • Data Scientist
  • Data Protection Officer
  • etc

Pour une dernière recommandation de bonne pratique pour une gouvernance des données réussie, Christina Poirson nous explique l’importance de connaître son environnement data ainsi que de connaître son appétence aux risques, les règles de chaque métier, industrie et service pour réellement faciliter l’accessibilité aux données et le respect des lois. 

 

…et les erreurs à éviter ?

Pour finir la table ronde, Chafika Chettaoui nous parle des erreurs à éviter pour réussir sa gouvernance. Selon elle, il ne faut surtout pas commencer par la technologie. Même si évidemment, la technique et l’expertise sont essentielles à une mise en oeuvre d’une gouvernance des données, il est très important de se concentrer tout d’abord sur la culture de l’entreprise. 

Chafika Chettaoui affirme : “Mettre en place une culture des données avec des formations est essentielle. D’un côté il faut casser le mythe que les données et l’IA sont “magiques”, et d’un autre côté casser le mythe de “l’intuition” de certains experts, en expliquant l’importance des données dans l’entreprise. L’aspect culturel est clé, et à tout niveau de l’organisation. ” 

Outil de gouvernance de données : Lean Data Governance Canvas

Outil de gouvernance de données : Lean Data Governance Canvas

lean data governance canvas

Inspiré par le business modèle « Lean Canvas » de Ash Maurya, le Lean Data Governance Canvas de Zeenea est destiné aux gestionnaires des données dont les missions sont de clarifier et d’orchestrer la gouvernance des données au sein de leurs organisations. D’un point de vue méthodologique, le Lean Data Governance Canvas est composé de deux parties principales :

  • Les éléments de gauche qui représentent ceux d’un système de gouvernance
  • Les éléments de droite qui sont inhérents à une organisation

Il est important de savoir que ce Lean Data Governance Canvas est un toolkit pour la mise en œuvre d’une gouvernance des données. Les intervenants devront itérer afin de réaliser un LDGC avec le moins d’hypothèses possible dans le temps.

Cependant, soyez attentifs ! Il ne doit pas y avoir un seul Canvas qui représente l’ensemble de l’entreprise, mais plutôt des canvas distincts pour les niveaux stratégiques et opérationnels.

Les idées mises en évidence dans le Lean Canvas devront être cohérentes et respecter les objectifs stratégiques de l’entreprise.

Lean Data Governance Canvas: la méthode

0- Objectifs stratégiques

Avant de commencer votre aventure avec le Lean Data Governance Canvas, il est important de mettre en évidence les attentes stratégiques de l’entreprise et de vous interroger :

Quels sont les objectifs stratégiques de l’entreprise et du conseil d’administration ?
Comment cela s’applique-t-il au département data et IT ?

1 & 2 – Segmentation des Data citizens et leurs problèmes

Commencez par réfléchir à un type de persona. Ensuite, vous pouvez prendre le temps de réfléchir à jusqu’à trois challenges que ce groupe doit relever :

Qui sont les Data Citizens auxquelles vous souhaitez vous adresser ?
Quels sont les trois principaux problèmes/risques que la gouvernance des données cherche à résoudre pour le segment défini ?

Vos citoyens de données sont soit les responsables de votre gouvernance de données (propriétaires de données, gestionnaires de données, gardiens informatiques, etc.), soit les producteurs / consommateurs des données (management, supply-chain, CRM, data science, marketing, etc). Vos risques peuvent concerner une ou plusieurs de ces personnes.

3 – Conformité réglementaire

La transformation digitale entraîne une plus grande conformité réglementaire (comme le RGPD par exemple). Pour garder vos contraintes à l’esprit, notez vos exigences réglementaires et posez-vous la question suivante:

Quels sont les risques découlant des exigences réglementaires (y compris de surveillance) ?

4 – Proposition de valeur

Cette partie du LDGC se concentre sur la valeur que la gouvernance des données apportera aux citoyens des données segmentés.

Pourquoi repousser la mise en œuvre d’une gouvernance des données pour les segments définis ?

La proposition de valeur est unique, congruente et engageante pour les utilisateurs concernés par les données. La communication ou le support marketing peuvent parfois être une aide précieuse pour formaliser une proposition de valeur. N’hésitez pas à vous rapprocher des équipes internes concernées.

5 – Solutions

Dans cette section sont définis les moyens et les principes qui permettront de surmonter les problèmes de vos segments et de s’orienter vers la proposition de valeur. Sans trop entrer dans les détails:

Quels sont les 3 grands principes qui permettront de répondre aux problèmes des segments des citoyens de données ?

Dans ce Canvas, une solution ne doit pas tenir compte de ce qui existe déjà et n’est pas déterminée en fonction du temps ou du budget. Le Canevas n’est pas un projet de timing, mais un projet à venir qui doit être considéré comme un MVP (minimum viable product) pour une première étape.

6.1 – Indicateurs ciblés

Ces indicateurs définissent la performance de la gouvernance des données établie dans le segment de vos citoyens de données. Ils mesureront la résolution du problème et la valeur de vos règles de gouvernance.

Quels sont les indicateurs clés à mesurer pour valider l’avancement de la proposition de valeur recherchée ?

6.2 – Indicateurs de connectivité

Ces mesures sont des indicateurs qui définissent la performance de la gouvernance des données mise en œuvre sur les sources d’information que vous avez énumérées précédemment.

Quels sont les indicateurs clés à mesurer pour valider la performance des règles de gouvernance des données sur une source ?

7 – Sources des données

Quelles sont les sources de données « absolument nécessaires » qui apporteront le plus de valeur au début de vos segments de data citizens définis ?

Les sources de données sont des atouts précieux pour les équipes data-driven. L’objectif est donc de trouver la valeur. La production de masse et l’exhaustivité induisent une complexité immédiate qui ne peut pas être facilement contrôlée. Le choix doit être fait en fonction de la valeur des données selon les usages de l’entreprise.

8 – Besoins technologiques

Identifiez les besoins technologiques qui doivent être acquis pour mesurer les paramètres de gouvernance et / ou réaliser la proposition de valeur.

Quelles sont les technologies et les outils nécessaires pour mesurer les paramètres associés ?

9 – Besoins humain

Identifiez les compétences et les ressources nécessaires pour donner vie à la gouvernance des données, l’animer et la mesurer dans le segment de données ciblé.

Qui sont les personnes concernées et quelles sont les astuces et interactions nécessaires pour tendre vers la proposition de valeur et de son maintien ?

 

L’évolution du Lean Data Governance Canvas au fil du temps

Après s’être concentré sur ces premiers pas, il est important de le tester ! Nous encourageons les utilisateurs du Lean Data Governance Canvas à retravailler cet outil autant que possible – par itération – et à les tester, après quoi un modèle de gouvernance des données gagnant devrait apparaître. Malgré la difficulté de ces ateliers, nous sommes convaincus que ce travail vous fera gagner du temps, de l’énergie et de l’argent. Pensez-y, avec le Lean Data Governance Canvas, il est possible de construire quelque chose que tout le monde dans l’entreprise veut et respecte.

 

Téléchargez notre toolkit sur la gouvernance des données

Chez Zeenea, nous utilisons cet outil, entre autres, pour mettre en place des programmes de gouvernance des données. Grâce à notre plateforme de gestion des métadonnées, connectez-vous à toutes vos sources de données qui importent et en mettent à jour automatiquement vos données dans un référentiel central. Notre outil permet à quiconque – avec les capacités nécessaires – de découvrir, comprendre et avoir confiance dans le patrimoine de données de l’entreprise.

Les entreprises font confiance à Zeenea pour relever les défis de la mise en place d’une gouvernance des données efficace dans un environnement de démarrage lean : promouvoir l’utilisation des données en interne tout en limitant les risques!

La Data Gouvernance et les données des ERP et CRM: un must.

La Data Gouvernance et les données des ERP et CRM: un must.

Depuis trois décennies, les entreprises s’appuient sur des progiciels de gestion intégrés (ERP) et de gestion de la relation client (CRM) pour mener à bien leurs activités.

Pour répondre à la nécessité de se conformer aux réglementations, de réduire les risques, d’améliorer la rentabilité, la compétitivité et l’engagement des clients, elles se doivent de devenir « Data Driven ».

Outre la nécessité de tirer parti d’une grande variété de nouvelles données produites en grande quantité par de nouveaux canaux, les données stratégiques de ces systèmes historiques doivent être embarquées dans toute initiative “Data Driven”.

 

Les défis des entreprises qui tentent d’exploiter les données des systèmes ERP/CRM pour alimenter leurs initiatives digitales

Dans la ruée vers l’or que les entreprises poursuivent avec l’intelligence artificielle, l’Analytics et dans tout programme de transformation digitale, la compréhension et l’exploitation des données des ERP et CRM  est sur le chemin critique de toute gouvernance des données.

Tout d’abord, ces systèmes disposent de modèles de bases de données volumineux, difficiles à comprendre et personnalisés. Comprendre les descriptions, les définitions des relations et tout autre moyen de servir les utilisateurs de ces données est presque impossible sans un data catalog approprié comme Zeenea avec ses connecteurs ERP/CRM ad hoc.

À titre d’exemple, SAP dispose de plus de 90 000 tables. Par conséquent, un data scientist ne comprendra pas la table dite “TF120” dans SAP ou la table “F060116” dans JD Edwards.

Deuxièmement, l’identification d’un sous-ensemble complet de jeux de données précis et au service d’une initiative Data spécifique est une course d’obstacles.

En effet, un grand pourcentage des tables de ces systèmes sont vides, peuvent sembler redondantes ou avoir des liens complexes pour ceux qui ne sont pas des experts du domaine ERP/CRM.

Troisièmement, le besoin d’initiatives “Data Driven”, agiles et axées sur un ROI rapide, place le personnel compétent en matière d’ERP/CRM au milieu de la mêlée.

Les experts en ERP/CRM sont des ressources rares, occupées et coûteuses et les entreprises ne peuvent pas se permettre d’augmenter ces équipes ou de les voir perdre leur concentration.

Quatrièmement, si le data catalog n’est pas en mesure de correctement stocker les métadonnées pour ces systèmes, de manière fluide, complète et efficace, toute initiative de données sera privée d’une grande partie de ses capacités.

Le besoin de données financières, de données de fabrication et de données clients, pour ne prendre que quelques exemples, est évident et fait donc des systèmes ERP/CRM des sources de données obligatoires pour tout programme de gestion des métadonnées.

 

Proposition de valeur de Zeenea

 

Un moyen agile et facile

Chez Zeenea, nous croyons en un monde de Data Democracy, où tout employé peut découvrir, comprendre et faire confiance à tout jeux de données qui lui est utile.

Cela n’est possible qu’avec un data catalog à l’épreuve de la réalité, qui se connecte facilement et directement à n’importe quelle source de données, y compris celles provenant des progiciels ERP/CRMP.

Enfin et surtout, un data catalog doit être intelligent, facile à utiliser, facile à mettre en œuvre et facile à intégrer dans un paysage informatique complexe.

Une large connectivité

Zeenea fournit des « connecteurs Premium ERP/CRM » pour les packages suivants

  • SAP et SAP/4HANA
  • SAP BW
  • Salesforce
  • Oracle E Business Suite
  • JD Edwards
  • Siebel
  • Peoplesoft
  • MS Dynamics EX
  • MS Dynamics CRM

 

Zeenea Les connecteurs “ERP/CRM Premium” aident les entreprises dans les domaines suivants:

Découvrir et évaluer

Les connecteurs Zeenea aident les entreprises à construire une couche de traduction automatique, masquant la complexité des tables de base de données sous-jacentes et alimente automatiquement le registre des métadonnées avec des informations précises et utiles, ce qui permet à l’équipe de gouvernance des données d’économiser du temps et de l’argent.

Identifier et isoler les informations utiles sur les métadonnées pour des cas spécifiques.

Dans un monde composé de milliers de jeux de données, Zeenea fournit un moyen de construire des modèles précis et autosuffisants pour répondre à des besoins ciblés en extrayant de manière exhaustive :

  • Business and technical names for tables
  • Business and technical names for columns in tables
  • Relationships between tables
  • Data Elements
  • Domains
  • Views
  • Indexes
  • Table row count
  • Application hierarchy (quand c’est possible)

Conformité

Les « connecteurs ERP/CRM Premium » de Zeenea sont capables d’identifier et marquer toute donnée personnelle ou PII  provenant de ses progiciels CRM/ERP supportés dans son data catalog afin de respecter la réglementation GDPR/CCPA.

Qu’est-ce que le metadata management ?

Qu’est-ce que le metadata management ?

« By 2021, organizations will spend twice as much effort in managing metadata compared with 2018 in order to assess the value and risks associated with the data and its use. »

*Gartner, The State of Metadata Management

La définition de metadata management

Avant de définir ce qu’est un metadata management (ou gestion des métadonnées en français), prenons un moment pour revoir les fondamentaux : Quelle est la différence entre une donnée et une métadonnée ?

Si malheureusement le temps vous manque, retenez simplement, qu’une métadonnée permet de contextualiser une donnée via les très appréciés 5 W : Who?, What?, When?, Where?, Why?

Ces questions répondent ainsi à un objectif clair : comprendre la donnée en vue de l’utiliser en état de pleine conscience.

Avec l’arrivée du Big Data et des différentes réglementations data, les leaders de la donnée doivent gagner en maturité sur leurs projets data au travers d’efforts centrés sur les métadonnées. Celles-ci sont partout : dès lors qu’une donnée est générée un ensemble d’informations la contextualisant apparaît.

Prenons l’exemple, d’un fichier excel recensant une liste de contacts. Les données sont les prénoms, noms, emails et adresses postales et les métadonnées de ce jeux de données seraient sa date de création, le nom du fichier, les auteurs associés, la taille et le poids du fichier ou encore des commentaires laissés dans le document.

Cette discipline autour de la gestion des métadonnées n’est pas quelque chose de révolutionnaire en tant que tel. Les entreprises ont compris son importance en réalisant, là encore, des fichiers excels. Le vrai virage aujourd’hui pour les entreprises data-driven est de s’outiller dans le metadata management avec des solutions qui sauront passer d’une métadonnée simplement passive à une information active et exploitable pour des cas d’utilisation tels que : se conformer aux réglementations, mettre en place une gouvernance des données et comprendre la valeur de ses données.

Pourquoi faut-il implémenter une stratégie de metadata management?

Le premier cas d’usage concernant la gestion des métadonnées est de faciliter la découverte et la compréhension du patrimoine de données de l’entreprise.

Ceci requiert la mise en place d’un référentiel de métadonnées, son remplissage et sa mise à disposition d’informations.

Voici quelques bénéfices, entre autres, du metadata management :

  • Une meilleure compréhension du sens des données du patrimoine de l’entreprise,
  • Une communication sur la sémantique des données via un data catalog,
  • Les leaders de la données sont plus productifs et efficaces, ce qui accélère la livraison des projets,
  • L’utilisation des dictionnaires de données et glossaires métier permet d’identifier des synergies et vérifier la cohérence des informations,
  • Renforcement de la documentation d’une donnée (suppression, archives, qualité, …),
  • La génération de pistes audits et d’informations (risque et sécurité pour la conformité).

Gérez vos métadonnées avec Zeenea

Avec Zeenea, transformez vos métadonnées en connaissances exploitables !

Notre plateforme de metadata management organise et met à jour automatiquement vos informations à partir de vos systèmes de stockage. Elle devient une source unique d’informations pour tout utilisateur de la donnée dans l’entreprise.

Le bilan des DPO sur le RGPD

Le bilan des DPO sur le RGPD

Depuis mai 2018, le règlement général sur la protection des données (RGPD) oblige les entreprises à assigner un “DPO”, ou Data Protection Officer au sein de leur organisation. Ce nouveau métier consiste à gérer les données personnelles et à informer les autres employés des obligations à respecter au regard de la réglementation européenne.

Plus d’un an après la mise en place de cette réglementation, nous avons animé un atelier avec des DPO de différents secteurs d’activités avec une seule idée en tête : Comment les aider dans la mise en application du RGPD ? Nous vous partageons aujourd’hui leurs retours.

État des lieux

Pour mieux comprendre les Data Protection Officers et leur fonction, faisons déjà un constat de leur situation actuelle.

Les outils

Notre audience confirme que les applications ne sont qu’un moyen à la mise en place d’une gouvernance sur les données.

Les entreprises ont malgré tout adopté de nouveaux outils pour les aider à la mise en place du RGPD. Ces logiciels sont souvent jugés peu intuitifs et difficiles à utiliser. Toutefois, certains arrivent à se démarquer :

Parmi les outils du DPO, nous avons listé les très appréciés catalogues d’applications, principalement pour la vision macro offerte des échanges entre applications et la détection facile et rapide des informations personnelles en leur sein.

En parallèle, les data catalogs, derniers arrivés sur le marché, font mouche auprès de la communauté des DPO. Investir dans ces outils est un choix stratégique que certains participants ont déjà entrepris. La possibilité d’informer et historiser l’information sur les données, en allant recenser les données collectées par l’entreprise, les a en effet conquis !

La gouvernance

Les DPO ont bien conscience que l’effort doit être placé sur l’acculturation et une sensibilisation des collaborateurs pour espérer de meilleurs résultats.

La recherche d’une gouvernance n’a pour but que d’aider les métiers à appréhender et évaluer les risques sur les données qu’ils manipulent. Leur énergie est ainsi placée sur la mise en place d’un pilotage efficace et une communication de règles partagées afin que l’entreprise acquiert les bons réflexes. Car oui, la donnée reste un sujet que peu de collaborateurs maîtrisent en entreprise.

Les systèmes d’information

L’hétérogénéité des systèmes d’information est un environnement “normal” auquel les DPO sont confrontés.

Ils sont ainsi confrontés à essayer par tous les moyens de mettre en conformité des SI qui s’avèrent bien souvent complexes et coûteux à mettre à jour techniquement.

À l’international

Nous associons aux DPO le fameux Règlement Des Données RGPD, en oubliant bien souvent “le reste du monde”.

De nombreux pays ont également leur propre règlements comme la Suisse et les Etats Unis. Les DPO n’y échappent pas et l’entreprise non plus !

Une chose est sûre, l’ampleur du travail est gigantesque et demande une forte priorisation des sujets. Mais au-delà des priorisations liées à l’urgence, cela demande de trouver le bon curseur entre répondre aux normes de conformités et répondre aux exigences business !

Les challenges des DPOs pour 2020

Face à ce précédent constat, l’atelier s’est conclu sur 2020 et ses nouveaux challenges.

Nous avons réalisé avec eux la liste des “résolutions” pour la nouvelle année :

  • Investir plus sur l’amélioration de la qualification et l’exigence de la documentation des données,
  • Intégrer plus d’exemples dans la phase de sensibilisation des collaborateurs sur les bonnes pratiques,
  • Apporter des indicateurs précis sur l’usage et la finalité de la donnée afin de prévoir au plus tôt les risques et impacts de celle-ci,
  • Devenir une partie prenante dans la mise en place d’une gouvernance des données afin de garantir une acculturation efficace sur la donnée en entreprise.
[Infographie] Qu’est ce qu’une Data Democracy?

[Infographie] Qu’est ce qu’une Data Democracy?

“Ce qui distingue les géants du Web, ce n’est pas la structure de leur gouvernance mais la culture qui irrigue et anime cette organisation.”

Une démocratie, en termes simples, est une forme de gouvernement où tout le monde a le pouvoir de choisir la législation de son pays. En ce qui concerne les données, la Data Democracy (démocratie des données en anglais) fait référence à toutes les personnes ayant le pouvoir d’accéder et comprendre les informations de leur entreprise.

 

La Data Democracy n’est pas un modèle de gouvernance

Contrairement à ce que son nom indique, une Data Democracy n’est pas un modèle de gouvernance.  Il ne s’agit absolument pas d’un modèle dans lequel les règles gouvernant la distribution des données seraient mises au vote et définies selon une approche majoritaire. Ni d’une organisation dans laquelle les Data Stewards seraient les représentants élus d’opérationnels constitués en corps électoral.

La Data Democracy désigne une culture d’entreprise, un modèle ouvert où liberté rime avec responsabilité.

Son objectif principal est de rendre la donnée de l’entreprise largement accessible au plus grand nombre, si ce n’est à tous. En effet, tout collaborateur est en mesure de pouvoir tirer de la valeur des données à quelque niveau que ce soit.

 

Comment est née la Data Democracy ?

 

Afin de mieux comprendre la Data Democracy, il est nécessaire de la comparer à d’autres cultures de la donnée. Elles sont :

  • Data Anarchy : un régime où les opérationnels métier développent chacun dans leur coin des bases clandestines (“shadow IT”) qui servent leurs intérêts immédiats.
  • Data Monarchy : un régime qui se traduit par une très forte asymétrie de l’accès aux données selon la position dans la hiérarchie. 
  • Data Aristocracy : un régime qui se caractérise par un degré de liberté plus important que la Data Monarchy, mais uniquement réservé à un sous-ensemble de la population, très ciblé.
  • Et enfin, la Data Democracy.

En savoir plus sur les cultures data

Le leitmotiv de cette approche est une ouverture au plus grand nombre sur le potentiel qu’offre la donnée. Cette liberté d’accès offre des possibilités maximales de création de valeur pour l’entreprise ; elle permet à tout collaborateur de pouvoir, à son niveau, utiliser l’ensemble des ressources accessibles et compatibles avec son besoin pour produire localement de la valeur.

Cette liberté ne fonctionne que si des règles et des outils élémentaires sont mis en œuvre et que chaque collaborateur est responsabilisé dans l’usage qu’il fait des données. Cela requiert donc de diffuser l’information nécessaire et suffisante pour lui permettre de faire un usage approprié, dans le respect des règles

 

Les droits et les devoirs d’un Data Citizen en infographie

L’approche démocratique présente un défi d’équilibre intéressant : il faut d’un côté s’assurer que le droit d’utiliser les données peut véritablement être exercé, et de l’autre contrebalancer ce droit par un certain nombre de devoirs.

Le droit accordé à tout collaborateur d’utiliser les données de l’organisation pour ses activités propres n’est tangible qu’à compter du moment où ce même collaborateur dispose de l’information nécessaire pour identifier et localiser les données dont il pourrait avoir besoin.

En retour, le collaborateur doit aussi être sensibilisé aux responsabilités qu’il doit assumer lorsqu’il souhaite faire usage des données. Elles peuvent être là aussi adaptées au contexte de l’entreprise mais aussi à la nature des données offertes.

Ci-dessous, une infographie qui liste certains droits et devoirs de chacun :

Téléchargez notre livre blanc sur la Data Democracy

L’adoption d’une culture de la donnée ne peut se faire que si chacun est gagnant. Pour en savoir plus sur la mise en place et avantages d’une Data Democracy, téléchargez notre livre blanc:

« Quelle organisation pour une gouvernance des données agile ?”

Quelle stratégie de gouvernance des données pour mon secteur d’activité ?

Quelle stratégie de gouvernance des données pour mon secteur d’activité ?

Dans notre dernier article, nous expliquons pourquoi la gouvernance des données est une discipline essentielle à mettre en place. Nous avons également parlé des différences entre une gouvernance défensive et offensive pour réaliser votre stratégie data.

Dans ce nouvel article, nous voulons nous concentrer sur le type de gouvernance des données nécessaire en fonction de votre secteur d’activité.

En effet, quand il s’agit de la mise en place d’une gouvernance des données, l’approche que va prendre une entreprise va dépendre de son environnement business. Il n’y pas de manière unique pour mettre en œuvre une stratégie de gouvernance des données : elle varie de secteur en secteur.

Ici, nous avons analysé trois différents secteurs d’activité : le secteur de la santé, celui du retail / ecommerce et celui de la banque / assurance. Nous avons identifié quelles approches de gouvernance ces industries mettent en place aujourd’hui, et quelles seront celles de demain.

La santé et la gouvernance des données

La santé étant un domaine très réglementé, ce secteur adopte une approche défensive quant à leur gouvernance des données.

En effet, ces organisations possèdent un nombre colossal de données sensibles sur leurs patients. Il est donc important de protéger et de connaître la qualité de celles-ci : elles sont utilisées pour sauver des vies, traiter des symptômes spécifiques, trouver de nouveaux remèdes… de mauvaises données et informations peuvent donc entraîner de gros risques !

Cependant, nous voyons de nouvelles entreprises apparaître dans le domaine de la santé, surtout dans la “Healthtech”, ce qui bouscule ce secteur d’activité. Avec cette nouvelle concurrence, les hôpitaux et autres entreprises du monde de la santé se doivent d’aller vers une approche plus offensive dans les années à venir.

Ce secteur devra trouver un juste équilibre entre maintenir son approche défensive forte et faciliter l’innovation pour créer de nouveaux services et garder la tête hors de l’eau.

Retail / ecommerce et la gouvernance des données

De l’autre côté du spectre, les entreprises dans le retail (physique ou sur internet) optent pour une approche de gouvernance des données offensive.

L’industrie voit apparaître de nouveaux acteurs chaque année, voire chaque mois, chaque jour ! Avec toute cette concurrence, il est essentiel que ces organisations se démarquent à l’aide de l’analyse des données pour proposer des offres personnalisées, des produits innovants, etc.

Cela dit, les consommateurs deviennent de plus en plus méfiants quant à partager leurs données. Avec l’émergence du Machine Learning et de techniques d’intelligence artificielle, les consommateurs questionnent l’éthique concernant l’usage de leurs données. De plus, les réglementations concernant la confidentialité et la sécurité des données personnelles obligent les entreprises de ce secteur à modifier leurs stratégies de gestion des données pour se conformer à ces nouvelles lois.

À l’avenir, les entreprise dans le retail devront opter pour une approche défensive tout en continuant à produire de la valeur et à innover.

Les banques / assurances et la gouvernance des données

Les industries de la banque et de l’assurance se retrouvent pile au milieu.

Tout comme le domaine de la santé, les banques et assurances travaillent avec des données personnelles, ce qui nécessite une gouvernance des données défensive afin de se conformer aux divers règlements à ce sujet.

Mais encore une fois, ces industries voient de nouveaux acteurs arriver dans le marché. Avec toutes les infrastructures sur le web, services digitaux, et offres personnalisées, la stratégie de gouvernance des données est en pleine mutation. Ces secteurs se retrouvent donc au milieu d’une grande concurrence et d’une grande responsabilité éthique !

Le challenge de demain sera de maintenir leur position défensive et offensive afin de faire face aux géants du web et aux lois sur les données.

Comment démarrer une stratégie de gouvernance des données ?

Démarrer la mise en place d’une stratégie de gouvernance des données peut être une tâche difficile !

Chez Zeenea, nous avons créé un Lean Data Governance Canvas pour vous aider à poser et à répondre aux bonnes questions !

Tout comme le fameux « Lean Canvas », nous avons réorganisé les éléments pour aider les entreprises à mettre en place une gouvernance des données « lean » et trouver la bonne approche pour votre gouvernance des données.

Pourquoi la gouvernance des données est-elle essentielle pour votre entreprise ?

Pourquoi la gouvernance des données est-elle essentielle pour votre entreprise ?

>> Revoir notre webinar (ANGLAIS) <<

La gouvernance des données a très certainement été un sujet tendance en 2019 ! Les entreprises prennent conscience de l’importance de gérer son patrimoine de données efficacement.

Pour bien comprendre ce qu’est la gouvernance des données, il existe plusieurs définitions :

“Data governance is a quality control discipline for adding new rigor and discipline to the process of managing, using, improving and protecting organizational information.”
IBM Data Governance Council 

“Data governance is the exercise of authority and control (planning, monitoring, and enforcement) over the management of data assets.”
Dama DMBok

“Data Governance is a system of decision rights and accountabilities for information-related processes, executed according to agreed-upon models which describe who can take what actions with what information, and when, under what circumstances, using what methods.”
The Data Governance Institute

“Data governance is the formal orchestration of people, processes, and technology to enable an organization to leverage their data as an enterprise asset.”
MDM Institute

Ce qui est certain c’est que ces explications sont loin d’être fun ! Avant de tenter de la définir, regardons de plus près les raisons pour lesquelles la gouvernance est devenue un sujet stratégique.

 

Qu’est-ce qui pousse les entreprises à mettre en œuvre une gouvernance des données ?

D’après nos expériences, les entreprises ont généralement un ou plusieurs de ces problèmes au sein de leur organisation :

Connaissances tribales : généralement, les entreprises ont une personne ou un groupe sélectionné de personnes qui produisent, travaillent et comprennent leurs informations. Cependant, le reste de l’organisation n’a aucune connaissance de ces informations (d’où elles proviennent, leur valeur, leur qualité, etc.). Les entreprises disposent ainsi d’informations silotées, difficiles à utiliser et à partager.

Big mess : au cours de ces dernières années, de nombreux systèmes d’informations complexes sont apparus, ce qui a conduit les entreprises à générer et stocker d’énormes quantités de données non organisées. Les utilisateurs ont donc à leur disposition des données dont la qualité, l’utilisation ou même la localisation sont inconnues.

Conformité : Toutes les entreprises sont soumises à une certaine forme de conformité, que ce soit la confidentialité des données, l’utilisation générale des données ou l’éthique. Celles qui n’ont pas de gouvernance dans leurs organisations souffriront de ces règlements.

La mise en œuvre de la gouvernance des données aide donc les entreprises à résoudre ces problèmes !

Avec la gouvernance des données, les entreprises peuvent créer une organisation data fluent, organiser leurs données et se conformer aux exigences réglementaires.

Pourquoi la gouvernance des données échoue dans les entreprises

Cependant, beaucoup d’entreprises reporte la mise en œuvre d’une gouvernance des données. Ces organisations estiment que :

  • La gouvernance implique le contrôle et non la valeur
  • Cela ralentit les affaires
  • Il s’agit plus d’une préoccupation informatique que d’une préoccupation business
  • Les projets de gouvernance mis en œuvre ont échoué trop souvent auparavant
  • C’est trop gros, il n’y a pas de ressources disponibles
  • C’est bien d’en avoir, mais ce n’est pas une priorité

 

Quelle stratégie pour votre gouvernance des données ?

Pour autant, il est essentiel que les entreprises mettent en place une gouvernance des données adaptée. Il n’y a pas une façon unique de mettre en œuvre une gouvernance des données : les entreprises doivent définir les objectifs stratégiques auxquels doit répondre leur gouvernance.

Nous identifions deux axes stratégiques dans l’implémentation d’une gouvernance des données. 

Gouvernance des données défensive

Cette dimension de la gouvernance des données est davantage axée sur le contrôle et la gestion des risques. Ici, les entreprises s’assurent de respecter la conformité des données (comme le RGPD), la confidentialité et la sécurité. Ce cadre va de pair avec certaines des définitions vues ci-dessus.

Gouvernance des données offensive

Cette dimension est axée sur la production de valeur avec ces données. Avec une approche offensive de la gouvernance des données, les entreprises privilégient également l’innovation de leurs produits ou services.

Quelle est la différence entre les données et les métadonnées ?

Quelle est la différence entre les données et les métadonnées ?

“Data is content, and metadata is context. Metadata can be much more revealing than data, especially when collected in the aggregate.” 

— Bruce Schneier, Data and Goliath.

Les définitions : données et métadonnées

Pour beaucoup, il est difficile d’appréhender les concepts de donnée et de métadonnée. Bien que les deux soient une forme de donnée, leurs usages et leurs spécifications diffèrent complètement.

Premièrement, une donnée est une information.

Elle peut être une observation, une mesure, un fait, ou alors une description de quelque chose. Les données permettent à ses utilisateurs de découvrir des modèles et tendances présents dans le patrimoine de données d’une entreprise.

D’autre part, une métadonnée, fréquemment définie comme étant une “donnée sur la donnée”, fait référence aux détails spécifiques sur ces données.

Elle fournit des informations granulaires sur une donnée spécifique, par exemple : le type de fichier, le format, l’origine, la date, etc.

 

Les différences clés entre les données et les métadonnées

La donnée est simplement l’essence, le contenu qui fournit une description, une mesure, voire un rapport sur tout élément relatif au patrimoine de données de l’entreprise. Les métadonnées elles, décrivent les informations pertinentes sur lesdites données, donnant plus de contexte pour ses utilisateurs.

Les données peuvent être informatives, mais pas toujours. Prenons l’exemple des chiffres ou caractères non informatifs. Cependant, les métadonnées sont toujours informatives car il s’agit d’une référence à d’autres données.

Enfin, les métadonnées sont toujours considérées comme des informations traitées, à la différence des données qui peuvent être considérées comme non-traitées ou traitées.

 

L’importance des métadonnées dans une stratégie de gestion des données

Quand on crée une donnée, les métadonnées sont automatiquement créées (origine de la donnée, format, type, etc.). Toutefois, ces informations ne sont pas suffisantes pour gérer correctement les données ; Les data managers doivent investir du temps pour s’assurer que cet actif d’entreprise est correctement documenté, stocké et archivé sous une taxonomie compatible avec tous les autres actifs de l’entreprise. C’est ce que nous appelons la « gestion des métadonnées ».

Une meilleure gestion des métadonnées augmente la valeur des données. Elles permettent aux entreprises d’améliorer la qualité et la découverte des données, ce qui permet aux utilisateurs de mieux les comprendre. Sans métadonnées, les entreprises se retrouvent avec des jeux de données sans contexte, dont la valeur ne peut être exploitée.

Il est donc essentiel que les entreprises qui traitent des données disposent d’une solution de gestion des métadonnées. En mettant en place une plateforme de metadata management, les data users sont en mesure de découvrir, de comprendre et de faire confiance au patrimoine de données de leur entreprise.

Vous recherchez une solution de metadata management ?

L’évolution du Chief Data Officer en sponsor de la Data Democracy

L’évolution du Chief Data Officer en sponsor de la Data Democracy

Sous la pression de la transformation digitale, les Chief Data Officers ou CDO ont fait leur apparition au sein des grandes entreprises. Selon Gartner, 90% des grandes entreprises auront un CDO d’ici la fin de l’année 2019.

Les milliers de CDO nommés au cours des dernières années ont été chargés d’améliorer l’efficacité et la capacité de création de valeur de l’écosystème de l’information de leur organisation. C’est-à-dire qu’ils ont été invités à diriger leur organisation en traitant et en exploitant les informations avec la même discipline que ses autres actifs, plus traditionnels.

Les entreprises qui valorisent leurs actifs d’information surpassent leurs rivales en les utilisant pour réinventer, numériser ou éliminer les processus et produits existants.

La mission des CDO peut se résumer à exploiter et trouver de nouveaux usages aux données de l’entreprise et développer l’utilisation et la confiance des collaborateurs dans les données internes à l’entreprise. Nous l’avons vu, cette mission se heurte bien souvent à de puissants freins culturels au sein des organisations. 

 

L’évolution des missions du Chief Data Officer

Un CDO à plusieurs responsabilités au sein d’une entreprise. Gartner a identifié les principales responsabilités du CDO durant leur évènement annuel Data & Analytics à Londres en 2019. Ses responsabilités sont, entres autres, de:

  • Définir une stratégie data et analytics dans leur organisation
  • Superviser les initiatives opérationnelles répondant à la stratégie établie en amont
  • S’assurer que les informations mises à disposition sur les données sont de confiance et valorisables
  • Construire une gouvernance des données
  • Créer de la valeur business de l’analyse des données
  • Gérer les efforts en matière de data science
  • Opérer et maintenir les efforts sur l’infrastructure répondant aux besoins d’analyse des données
  • Autres.

Nous pensons qu’à cette impressionnante liste de responsabilités s’en ajoute une autre, susceptible de servir de fil rouge à toutes les autres et de les faciliter: promouvoir la Data Democracy, et accompagner le changement culturel qu’elle suppose le plus souvent.

Les CDO ont dû, dans un premier temps, partir en croisade pour évangéliser les organisations de l’intérêt d’exploiter les données. Les premières années de cette évangélisation se sont souvent accompagnées de la construction d’un univers de données adapté aux nouveaux usages, souvent sous la forme d’un Data Lake ou d’un Data Mart distribué.

Les investissements consentis pour construire ces univers de données ont été importants, mais le plus souvent, l’usage des données est resté réservé aux spécialistes. En bref, les organisations ont plutôt mis en place des Data Aristocracies plutôt qu’une Data Democracy.

Le CDO vers un nouveau rôle

Avec le développement exponentiel de la donnée, la fonction de CDO a pris une nouvelle envergure. Les CDO doivent désormais repenser de façon transverse et globalisante l’organisation.

Ils doivent devenir les nouveaux chefs de file de la « Data Democracy » au sein des entreprises et répondent à l’appel de nombreux « citoyens des données » qui ont compris que la manière dont les données sont traitées doit changer radicalement. Les nouveaux CDO doivent faire sauter les verrous des silos de données.

Pour recueillir l’adhésion de l’ensemble des collaborateurs aux initiatives de données, ils doivent non seulement les accompagner dans la compréhension de la data (contexte de l’origine, de la production, etc.) mais aussi les aider à s’investir dans la stratégie de production et d’exploitation des données.

L’implication des parties prenantes dans l’exploitation de la donnée doit désormais s’étendre à tous les niveaux de l’entreprise. C’est en facilitant la compréhension, les échanges et l’accès autour des données que les organisations deviendront data-driven !

Téléchargez notre livre blanc « Quelle organisation pour une gouvernance des données agile ? »

Pour ne pas engager chaque collaborateur à un niveau qui le dépasse et respecter ses envies et ses limites, une démarche participative saura mettre en œuvre plutôt des équipes pluridisciplinaires qui accueilleront les compétences nécessaires et les postures adéquates au déploiement de la gouvernance. Découvrez davantage sur comment le rôle du Chief Data Officer évolue dans notre livre blanc.

Comprendre les différentes cultures de la donnée

Comprendre les différentes cultures de la donnée

Comme un culture organisationnelle, chaque entreprise travaillant avec la donnée a sa propre culture data. Nous pensons que ce qui distingue les géants du Web, ce n’est pas la structure de leur gouvernance mais la culture qui irrigue et anime cette organisation.

Chez Zeenea, nous recommandons la mise en place d’une Data Democracy. Une Data Democracy désigne une culture d’entreprise, un modèle ouvert où liberté rime avec responsabilité.

Un bon moyen de mieux comprendre la Data Democracy est de la comparer à d’autres cultures de la donnée. Voici les principales cultures data:

 

La Data Anarchy

Dans ce régime, les opérationnels métier s’estiment mal servis par le département informatique, et développent chacun dans leur coin des bases clandestines (“shadow IT”) qui servent leurs intérêts immédiats en s’affranchissant de toute règle sur le contrôle et la conformité des usages.

En 2019, cette culture est porteuse de risques massifs (fuite de données, contravention aux règles éthiques, juridiques ou réglementaires, dégradation de la qualité de service, renforcement des silos, etc.).

 

La Data Monarchy

Ce régime se traduit par une très forte asymétrie de l’accès aux données selon la position dans la hiérarchie. Les données sont très fortement contrôlées, leur niveau de consolidation soigneusement aligné avec l’organigramme, et leur distribution très sélective.

Cette culture monarchique est celle qui a longtemps prévalu dans les projets de Business Intelligence (BI) : les données collectées dans le data warehouse sont soigneusement contrôlées, puis consolidées dans des rapports dont l’accès est réservé à quelques privilégiés proches des instances de décision. Cette culture promeut massivement une approche “top down” et favorise plus volontiers une stratégie défensive, où la mise en place de règles, de contraintes et de contrôles sanctuarise les données. Le bénéfice théorique principal est un contrôle quasi infaillible sur la donnée d’entreprise, mais cela se traduit aussi par une accessibilité très limitée et réservée à certaines castes privilégiées.

 

La Data Aristocracy

Ce régime se caractérise par un degré de liberté plus important que la Data Monarchy, mais uniquement réservé à un sous-ensemble de la population, très ciblé, principalement sur les collaborateurs aux profils experts (Data Engineers, Data Analysts, Data Scientists, etc.).

Ce régime aristocratique est souvent celui qui émerge des projets de gouvernance les plus réussis. Une telle culture peut être favorable à des stratégies plus offensives, ainsi qu’à des approches hétérogènes, mêlant top down et bottom up. Cependant, elle prive la majeure partie des collaborateurs de l’accès à la donnée, et par conséquent l’entreprise d’un certain nombre d’innovations et valorisations possibles.

 

La Data Democracy

La Data Democracy se fixe comme objectif principal de rendre la donnée de l’entreprise largement accessible au plus grand nombre, si ce n’est à tous. En effet, tout collaborateur est en mesure de pouvoir tirer de la valeur des données à quelque niveau que ce soit.

Cette liberté d’accès offre des possibilités maximales de création de valeur pour l’entreprise ; elle permet à tout collaborateur de pouvoir, à son niveau, utiliser l’ensemble des ressources accessibles et compatibles avec son besoin pour produire localement de la valeur, et par capillarité d’en faire profiter toute l’entreprise.

Cette liberté ne fonctionne que si des règles et des outils élémentaires sont mis en œuvre et que chaque collaborateur est responsabilisé dans l’usage qu’il fait des données. Cela requiert donc de diffuser l’information nécessaire et suffisante pour lui permettre de faire un usage approprié, dans le respect des règles.

Téléchargez notre livre blanc « Quelle organisation pour une gouvernance des données agile ? »

L’approche démocratique présente un défi d’équilibre intéressant : il faut d’un côté s’assurer que le droit d’utiliser les données peut véritablement être exercé, et de l’autre contrebalancer ce droit par un certain nombre de devoirs. Pour en savoir plus sur comment construire une culture data démocratique, téléchargez dès à présent notre livre blanc.

Data Stewardship et Gouvernance : les multiples facettes du Data Steward

Data Stewardship et Gouvernance : les multiples facettes du Data Steward

La notion de Data Stewardship est difficile à traduire en français. Littéralement, elle désigne l’intendance des données (ou pour les anciens scouts, l’économat des données). L’idée initiale était de confier à un expert du domaine le soin de qualifier et documenter les données de son univers métier. En effet, les Data Stewards sont ceux qui travaillent au plus près du lieu où les données sont collectées. Ce sont souvent ceux qui comprennent le mieux les différentes dimensions des données et les normes auxquelles elles doivent répondre.

 

Data Stewardship et gouvernance : les responsabilités

En pratique, le Data Stewardship recouvre un ensemble de responsabilités assez variable, selon la maturité de l’organisation dans laquelle il évolue. Nous catégorisons ces responsabilités dans quatre grandes catégories :

Supervision opérationnelle et qualité

Il s’agit de superviser le cycle de vie complet des jeux de données placés sous sa tutelle. Plus spécifiquement, le Data Steward doit définir voire implémenter les traitements nécessaires à l’acquisition, au stockage et à la distribution des jeux de données.

Il doit également s’assurer que les données produites répondent aux critères de qualité qu’il a définis (valeurs, intervalles, complétude, fraîcheur, etc.) et que des procédures sont en place pour évaluer et au besoin corriger les problèmes éventuels de qualité.

Documentation

Un Data Steward est chargé de définir et de documenter les données, et de construire un glossaire des termes métier applicables. Cela implique s’assurer que chaque élément du jeu de données possède une définition claire, et un usage défini.

La documentation est constituée d’un ensemble de métadonnées techniques et fonctionnelles conformément à un métamodèle en principe commun.

Conformité et gestion des risques

La protection des données, et la gestion des risques réglementaires, est l’un des aspects les plus exigeants du rôle de Data Steward. L’environnement réglementaire autour des données est de plus en plus contraignant et mouvant. C’est au Data Steward de s’assurer que la prolifération des données est encadrée par un ensemble de protocols assurant la conformité avec les normes applicables – notamment en matière de protection de la vie privé.

Sécurité et contrôle d’accès

Enfin, le Data Steward doit définir les règles régissant l’accès aux données, incluant les différents niveaux de confidentialité et les procédures permettant d’autoriser une personne ou un groupe de personne à accéder aux données.

Téléchargez notre livre blanc « Quelle organisation pour une gouvernance des données agile ? »

Orchestrée par un pôle de Data Management, mise en oeuvre par les différentes variantes du Data Steward, la gouvernance des données doit être déployée dans l’organisation. Pour assurer ce déploiement, plusieurs modèles opératoires sont en théorie envisageables – centralisé, fédéré, décentralisé, autonome, facilité, etc. Nous pensons que ce qui les distingue, ce n’est pas la structure de leur gouvernance, mais la culture qui irrigue et anime cette organisation. Cette culture porte un nom : la Data Democracy.

Qui sont les Chief Data Officers ?

Qui sont les Chief Data Officers ?

Selon une étude Gartner présentée lors de la conférence Data & Analytics à Londres 2019, 90% des grandes entreprises auront un CDO d’ici 2020 !

Avec l’émergence du Big Data, de nombreuses entreprises se retrouvent avec une quantité colossale de données sans savoir comment les exploiter. Pour répondre à cette question, une nouvelle fonction voit le jour au sein des grandes entreprises : celui du Chief Data Officer.

graph-cdo-gartner-fr

Le rôle du Chief Data Officer (CDO)

Considérés comme les gourous de la donnée, les Chief Data Officers (CDO) jouent un rôle clé dans la stratégie data de l’entreprise. Ils sont chargés d’améliorer l’efficacité et la capacité de création de valeur autour des données. Cette ambition s’accompagne de réflexions autour de la mise à disposition d’un patrimoine de données de qualité, managé et sécurisé. En d’autres termes, il s’agit de trouver le juste équilibre entre une gouvernance des données offensive et défensive correspondant aux besoins de l’entreprise.

 

stratégie data cdo

Selon l’étude Gartner, présentée lors de leur évènement annuel Data & Analytics à Londres en Mars 2019, le CDO a, entre autres, plusieurs responsabilités importantes au sein d’une entreprise :

 

Définir une stratégie data et analytics

Quelles sont les objectifs data à court, moyen et long terme ? Comment créer une culture de la donnée dans l’entreprise ? Quels moyens pour démocratiser l’accès aux données ? Comment mesurer la qualité du patrimoine de données ? Comment atteindre une conformité réglementaire interne et/ou légale ? Comment responsabiliser les utilisateurs de la donnée ?

Tant de questions qu’un CDO doit se poser afin de mettre en place une stratégie data & analytics au sein de leur organisation.

Une fois les problématiques cernées, vient le moment des initiatives opérationnelles. Le CDO joue le rôle de superviseur, afin que les efforts fournis dans la mise à disposition d’informations sur les données soient de confiance et valorisable.

Son rôle s’opère dans la durée. Il doit devenir le nouveau chef de file d’une « Data Democracy » au sein des entreprises et maintenir l’investissement fourni sur l’infrastructure et l’organisation.

 

Construire une gouvernance des données

La mise en place d’une gouvernance des données doit conjuguer avec bonheur le respect d’obligations réglementaires toujours plus exigeantes et l’exploitation la plus large des données dans tous les métiers de l’entreprise. Pour atteindre cet objectif, le CDO doit être à même de répondre à ces quelques premières questions :

  • Quelles données sont présentes au sein de son organisation
  • Ces données sont-elles suffisamment documentées pour être comprises et maı̂trisées par les collaborateurs de son organisation ?
  • D’où viennent-elles ?
  • Sont-elles sécurisées ?
  • Quelles règles ou restrictions s’appliquent à mes données ?
  • Qui sont les responsables ?
  • Qui utilise ces données ? Comment ?
  • Comment les collaborateurs peuvent y accéder ?

C’est en construisant de manière agile une gouvernance des données la plus offensive possible que les CDOs pourront faciliter l’accès aux données et assurer leur qualité en vue de les valoriser.

 

Évangéliser une culture « Data Democracy »

Data Democracy désigne l’idée selon laquelle si chaque employé peut accéder facilement et en toute connaissance à autant de données que possible, l’entreprise dans son ensemble en tirera le plus grand bénéfice. Ce droit d’accéder aux données s’accompagne d’un ensemble de devoirs et de responsabilités – parmi lesquels la contribution au maintien du plus haut niveau de qualité et de documentation sur les données. Dès lors, la gouvernance n’est plus la chasse gardée de quelques uns, mais devient l’affaire de tous.

Pour atteindre cette mission, Zeenea se connecte et fédère les équipes autour des données grâce à un langage commun. Notre data catalog permet à quiconque – ayant les habilitations nécessaires – de découvrir et croire dans le patrimoine data d’une entreprise.

 

Vous êtes CDO et vous avez besoin d’un outil de gouvernance des données ?

Afin de réussir ses missions, le CDO a besoin de s’équiper avec les bons outils. Avec le data catalog de Zeenea, les Chief Data Officers peuvent identifier leur patrimoine de données, le rendre accessible et utilisable par ses collaborateurs afin d’être valorisé. Simple d’utilisation et intuitive, notre data catalog est l’outil indispensable du CDO pour la mise en œuvre d’une gouvernance des données agile. Contactez-nous pour en savoir plus.

Comment une Data Democracy promeut la gouvernance des données agile ?

Comment une Data Democracy promeut la gouvernance des données agile ?

En 2018, nous avons publié notre premier livre blanc “Pourquoi démarrer une gouvernance des données agile ?”. Notre ambition est d’apporter un éclairage pragmatique sur les attributs de cette gouvernance de données capable de relever les défis de cette nouvelle ère de l’information : nous la souhaitons ascendante, non invasive, automatisée et itérative. En un mot, agile.

Dans un deuxième opus, nous avons décidé de nous attaquer avec le même état d’esprit à l’organisation de cette gouvernance des données, et à sa mise à l’échelle.

Nous pensons que ce qui distingue les Géants du Web dans leur approche avec la data, ce n’est pas la structure de leur gouvernance, mais la culture qui irrigue et anime leur organisation. Cette culture porte un nom : la Data Democracy.

Notre livre blanc abordera les thématiques suivantes :

 

Un état des lieux de la gouvernance des données

Notre livre blanc fait un état des lieux des organes de gouvernance que nous rencontrons aujourd’hui dans les organisations traditionnelles. Ces derniers sont souvent le produit d’une démarche défensive, héritée du Master Data Management ou d’initiatives plus larges de mise en place d’une gouvernance des systèmes d’information. Très centralisés, parfois bureaucratiques, ils se focalisent sur les indispensables fonctions de contrôle et de conformité, au détriment parfois radical de la simplicité d’accès aux données pour les acteurs de l’entreprise.

 

Le concept de « Data Democracy »

Afin de bien comprendre ce qu’est la Data Democracy, il est important de savoir que ce n’est pas un modèle de gouvernance.

La Data Democracy désigne une culture d’entreprise, un modèle ouvert où liberté rime avec responsabilité.

La Data Democracy se fixe comme objectif principal de rendre la donnée de l’entreprise largement accessible au plus grand nombre, si ce n’est à tous. En effet, tout collaborateur est en mesure de pouvoir tirer de la valeur des données à quelque niveau que ce soit.

Une approche démocratique présente donc un défi d’équilibre intéressant : il faut d’un côté assurer que le droit d’utiliser les données peut véritablement être exercé, et de l’autre contrebalancer ce droit par un certain nombre de devoirs.

 

Construire une culture « Data Democracy »

L’adoption d’une culture de la donnée ne peut se faire que si chacun est gagnant, d’où l’importance de la communication précédemment évoquée autour des droits et des responsabilités. La balance entre les deux doit être au final positive et la gouvernance ne doit pas introduire plus de contraintes que de gains. Enfin, l’ensemble doit être facilité.

Permettant à tous de trouver les informations nécessaires. Il s’agit de l’objectif principal d’un data catalog qui doit, encore plus que sa fonction élémentaire (référencer les données et métadonnées associées), offrir la simplicité d’usage pour naviguer dans un océan d’informations.

 

Les nouveaux rôles d’un gouvernance des données agile

Pour répondre à la pression de la transformation digitale, de nouveaux rôles apparaissent au sein des grandes entreprises.

 

Le Chief Data Officer : sponsor de la gouvernance des données agile

Parmi eux, il y a le Chief Data Officer ou CDO. Ils sont en charge de l’amélioration de l’efficacité et la capacité de création de valeur de l’écosystème de l’information de leur organisation.

Avec le développement exponentiel de la donnée, la fonction de CDO a pris une nouvelle envergure. Les CDO doivent désormais repenser de façon transverse et globalisante l’organisation, la gouvernance et la technologie de la gestion de la donnée dans les entreprises.

Ils doivent devenir les nouveaux chefs de file de la « Data Democracy » et répondent à l’appel de nombreux « citoyens des données » qui ont compris que la manière dont les données sont traitées doit changer radicalement. Les nouveaux CDO doivent faire sauter les verrous des silos de données.

Sommes-nous tous Data Steward ?

Le concept de Data Stewardship découle d’un modèle beaucoup plus traditionnel de gestion des données. Les organisations qui ont déjà des Data Stewards en place ont tendance à être assez grandes et bien établies.

Tous ceux qui utilisent des données sensibles engagent leur responsabilité quant à la manière dont ils utilisent les données. Les règles de protection des données sensibles – réglementaires ou internes – doivent s’appliquer de manière égale à tous ceux qui entrent en contact avec celles-ci.

Cette implication de tous aide à répartir la responsabilité des données, donne un sens de propriété plus large et encourage les utilisateurs à explorer eux-mêmes leurs données, à les décloisonner.

Téléchargez notre livre blanc « Quelle organisation pour une gouvernance des données agile ? »

Pour en savoir plus sur l’organisation d’une gouvernance des données agile, la définition d’une Data Democracy et les rôles concerné par celles-ci, téléchargez notre deuxième volume “Quelle organisation pour une gouvernance des données agile”.

Les 5 attributs d’une gouvernance des données agile : Itérative (5/5)

Les 5 attributs d’une gouvernance des données agile : Itérative (5/5)

La faible maturité des projets de gouvernance des données nécessite la mise en place de bonnes pratiques et boucles de feedback pour constamment monitorer et valider le bien fondé des règles de gestion sur votre patrimoine de données.

Les articles qui suivent, explicitent les caractéristiques d’une gouvernance des données dite agile afin de :

1. Être au plus près de la réalité opérationnelle de votre entreprise.
2. S’adapter au contexte de votre entreprise et non l’inverse.

3. Refléter fidèlement votre patrimoine de données.
4. Fédérer et impliquer vos collaborateurs.
5. Faire face aux changements rapidement.

La mise en place d’une gouvernance des données ne doit pas prendre la forme d’un plan quinquennal dont les livrables peinent à voir le jour.

Il s’agit d’éviter l’effet Big Bang et d’adopter une démarche influencée par les méthodes dites agiles utilisées dans le secteur du développement logiciel.

L’entreprise doit adopter une approche itérative concernant la mise en place d’une gouvernance des données. Cette approche repose sur le concept de vérification de la validité des concepts, l’expérimentation et le design itératif.

Nous pensons qu’un projet de gouvernance des données doit démarrer par un inventaire du patrimoine des données, de manière interfonctionnel, dans l’entreprise. En reprenant le principe de Pareto, collectez, documentez et commencez par maîtriser les 20% des données qui vous apporteront 80% de la valeur au sein de votre organisation.

En augmentant petit à petit sa portée sur vos différents segments de données, en re-définissant les rôles et responsabilités au sein de votre l’organisation, et les règles de gestion de la donnée, vous chercherez à concevoir une gouvernance qui vous satisfait.

Cette flexibilité encourage également l’émergence d’une culture de la donnée solide au sein de votre organisation.

Notre livre blanc sur la gouvernance des données agile

Les 5 attributs d’une gouvernance des données agile : Collaborative (4/5)

Les 5 attributs d’une gouvernance des données agile : Collaborative (4/5)

La faible maturité des projets de gouvernance des données nécessite la mise en place de bonnes pratiques et boucles de feedback pour constamment monitorer et valider le bien fondé des règles de gestion sur votre patrimoine de données.

Les articles qui suivent, explicitent les caractéristiques d’une gouvernance des données dite agile afin de :

1. Être au plus près de la réalité opérationnelle de votre entreprise.
2. S’adapter au contexte de votre entreprise et non l’inverse.

3. Refléter fidèlement votre patrimoine de données.
4. Fédérer et impliquer vos collaborateurs.
5. Faire face aux changements rapidement.

La pratique consistant à avoir une seule personne ou un seul groupe pour arbitrer la gouvernance des données est tombée en désuétude. La gouvernance des données ne doit plus être la chasse gardée de l’IT.

Les données circulent dans la hiérarchie, des cadres supérieurs aux employés débutants de tous les départements. Des informations sur la manière dont les données devraient être gérées et sur les règles à suivre peuvent provenir de n’importe où.

Créer une démocratie de la donnée, où tous les employés peuvent accéder aux données de l’entreprise à grande échelle, comme Facebook l’a fait, signifie que les employés n’ont pas à attendre pour exécuter des projets qui peuvent ajouter de la valeur.

Cela signifie également que les problèmes de données sont plus susceptibles d’être découverts et corrigés. Ceci est d’autant plus important dans un environnement où 85% des informations des organisations sont redondantes, obsolètes et triviales, et que 41% de toutes les données stockées n’ont pas été touchées depuis trois ans*.

Nous pensons que la pérennité d’une gouvernance de données doit passer par la création de communautés autour des différents domaines d’activités liés à la data au sein de votre organisation. Cette approche vise à mettre les individus et leurs interactions devant les processus et les outils.

En tant qu’actif partagé, il sera nécessaire de définir des règles de propriété et des domaines de responsabilité autour des données de l’entreprise.

Dans de nombreuses organisations, les parties responsables ont un rôle officiel à jouer en tant que « data owners », « data stewards » ou « data custodians ».

Si la désignation formelle de responsabilités reste primordiale, nous pensons qu’il est important d’impliquer un maximum de personnes dans la mise en place de la gouvernance des données, capables de contribuer à la connaissance, au contrôle et à la gestion des données.

Dit autrement : « Tout le monde est Data Steward ».

 

Notre livre blanc sur la gouvernance des données agile

Les 5 attributs d’une gouvernance des données agile : automatisée (3/5)

Les 5 attributs d’une gouvernance des données agile : automatisée (3/5)

La faible maturité des projets de gouvernance des données nécessite la mise en place de bonnes pratiques et boucles de feedback pour constamment monitorer et valider le bien fondé des règles de gestion sur votre patrimoine de données.

Les articles qui suivent, explicitent les caractéristiques d’une gouvernance des données dite agile afin de :

1. Être au plus près de la réalité opérationnelle de votre entreprise.
2. S’adapter au contexte de votre entreprise et non l’inverse.

3. Refléter fidèlement votre patrimoine de données.
4. Fédérer et impliquer vos collaborateurs.
5. Faire face aux changements rapidement.

La construction d’une gouvernance des données doit commencer par le référencement, l’indexation puis, l’évaluation du patrimoine de données de votre organisation.

Les tentatives de construction d’un tel artefact en utilisant uniquement du travail humain sont rarement couronnées de succès compte tenues des contraintes de ressources. Il est nécessaire d’automatiser au maximum le processus d’extraction et de collecte des informations liées aux données de vos organisations.

À l’aide d’algorithmes d’intelligence artificielle ou de machine learning, il devient possible d’interpréter, contextualiser et d’inférer un sens plus précis à votre patrimoine de données.

Cette automatisation permet à vos responsables des données d’éviter le syndrome de la feuille blanche et, les affranchira de tâches fastidieuses et répétitives, augmentant ainsi l’adhésion du plus grand nombre à votre initiative de mise en place d’une gouvernance des données au sein de votre entreprise.

Enfin, cette automatisation est devenue une nécessité dans une nouvelle ère où le volume et la variété des systèmes explosent. La maintenance et la mise à jour de ce référentiel d’informations sont cruciales pour refléter la réalité des données de votre SI.

À l’aide d’analyses incrémentielles, fréquentes et automatisées de vos données, vous dégagerez un référentiel de métadonnées à forte valeur ajoutée pour vos consommateurs de données.

 

Notre livre blanc sur la gouvernance des données agile

Les 5 attributs d’une gouvernance des données agile : Non intrusive (2/5)

Les 5 attributs d’une gouvernance des données agile : Non intrusive (2/5)

La faible maturité des projets de gouvernance des données nécessite la mise en place de bonnes pratiques et boucles de feedback pour constamment monitorer et valider le bien fondé des règles de gestion sur votre patrimoine de données.

Les articles qui suivent, explicitent les caractéristiques d’une gouvernance des données dite agile afin de :

1. Être au plus près de la réalité opérationnelle de votre entreprise.
2. S’adapter au contexte de votre entreprise et non l’inverse.

3. Refléter fidèlement votre patrimoine de données.
4. Fédérer et impliquer vos collaborateurs.
5. Faire face aux changements rapidement.

Les entreprises considèrent que les approches classiques d’Entreprise Data Management (EDM) imposent aux parties prenantes d’adopter un certain nombre d’outils et de procédures qui viennent alourdir les processus de découverte de la donnée devenant ainsi un obstacle à l’innovation. Dans un monde où la variété ainsi que les volumes de données explosent, où de nouveaux outils de stockage et traitements de la donnée apparaissent sans cesse, une approche plus raisonnable existe.

Il s’agit de laisser la liberté à vos collaborateurs d’utiliser les outils les plus adaptés pour leurs usages, que ce soit pour générer ou accéder à des jeux de données, selon leur niveau d’habilitation bien entendu !

Cette approche veut centraliser la connaissance que vos collaborateurs ont acquise sur les jeux de données dans des “catalogues de données”.

L’objectif est de collecter et d’agréger les métadonnées de vos jeux de données créées ou mises à jour depuis vos outils et systèmes de stockage. C’est depuis ces plateformes, décorrélées de l’opérationnel, que la gouvernance des données sera mise en oeuvre et ce, sans interférer dans le travail quotidien de vos collaborateurs.

Cette manière non intrusive d’adresser la gouvernance des données demande à l’entreprise d’avancer pas à pas.

Expérimentez et ajustez vos règles de gestion sur la donnée et sa métadonnée au fur et à mesure que vous établissez l’inventaire de votre patrimoine de données.

 

 

Notre livre blanc sur la gouvernance des données agile

Les 5 attributs d’une gouvernance des données agile : Bottom up (1/5)

Les 5 attributs d’une gouvernance des données agile : Bottom up (1/5)

La faible maturité des projets de gouvernance des données nécessite la mise en place de bonnes pratiques et boucles de feedback pour constamment monitorer et valider le bien fondé des règles de gestion sur votre patrimoine de données.

Les articles qui suivent, explicitent les caractéristiques d’une gouvernance des données dite agile afin de :

1. Être au plus près de la réalité opérationnelle de votre entreprise.
2. S’adapter au contexte de votre entreprise et non l’inverse.
3. Refléter fidèlement votre patrimoine de données.
4. Fédérer et impliquer vos collaborateurs.
5. Faire face aux changements rapidement.

La mise en place d’une gouvernance des données doit éviter les écueils, trop souvent vus par le passé, via une approche top-down.

Une démarche descendante veut que les objectifs et instructions soient fixés par la direction puis, mis en application. Cette conduite de projet, à l’instar du développement logiciels rencontré ces dernières années, s’est révélée trop hiérarchique et bureaucratique, décorrélée de la réalité du terrain et donc des données détenues par l’entreprise.

Nous préconisons une approche bottom up partant du terrain, au sens opérationnel, pour consolider progressivement une synthèse et maintenir une gestion de gouvernance des données correspondant au contexte réel de votre entreprise

Nous définissons une gouvernance des données bottom up par :

 

  • Une approche démocratique plutôt que hiérarchique.

  • Une volonté de résoudre les problèmes créés par la fluidité plutôt que d’imposer plus de structure.

  • Une “bureaucratie” réduite à son minimum facilitant sa mise en place et sa maintenance (principe provenant du travail “Minimum Viable Bureaucracy” de Spotify).

  • Une collaboration active des acteurs favorisant l’adhésion et la collecte d’informations sur les données de l’organisation.

  • Une autonomie des collaborateurs dans le choix des outils et la manière de s’organiser.

 

Notre livre blanc sur la gouvernance des données agile

Le rôle des métadonnées

Le rôle des métadonnées

Notre conviction exige qu’une entreprise fasse des compromis entre le contrôle et la flexibilité dans l’utilisation des données.

En clair, les entreprises doivent adopter une stratégie encourageant et facilitant l’utilisation des données, tout en minimisant les risques.

Nous sommes convaincus qu’une telle gouvernance sera atteinte si vos collaborateurs sont à même de répondre à ces quelques questions :

 

  • Quelles données sont présentes au sein de mon organisation ?

  • Ces données sont-elles suffisamment documentées pour être comprises et maîtrisées par les collaborateurs de mon organisation ?

  • D’où viennent-elles ?

  • Sont-elles sécurisées ?

  • Quelles règles ou restrictions s’appliquent à mes données ?

  • Qui sont les responsables ? Qui sont les “sachants” ?

  • Qui utilise ces données ? Comment ?

  • Comment vos collaborateurs peuvent y accéder ?

Ces métadonnées (informations sur les données) sont devenues des informations stratégiques au sein des entreprises. Elles décrivent diverses facettes, tant techniques qu’opérationnelles ou métier, des données que vous possédez.

En constituant un référentiel de métadonnées unifié, centralisé et accessible, vous garantissez des données précises, cohérentes et comprises dans toute l’entreprise.

 

Les bénéfices d’un référentiel de métadonnées

Nos expériences nous ont amené à valoriser une gouvernance fondée sur un management des métadonnées.

Nous sommes intimement convaincus qu’on ne peut gouverner ce qu’on ignore ! Ainsi, construire un référentiel de métadonnées constitue une base de travail solide pour démarrer une gouvernance sur vos données. Il vous permettra, entre autres, de :

 

  • Inventorier votre patrimoine ;

  • Attribuer des rôles et responsabilités sur vos données référencées ;

  • Être complété par vos employés de manière collaborative ;

  • Renforcer votre mise en conformité avec la régulation.

La concentration des efforts sur les métadonnées et la création d’un tel référentiel est une caractéristique clé d’une gouvernance des données à l’approche agile.

 

Télécharger le livre blanc

Pourquoi démarrer une gouvernance des données agile ?

Qu’est-ce qu’une gouvernance des données ?

Qu’est-ce qu’une gouvernance des données ?

La notion de gouvernance liée aux systèmes d’information est apparue dans les années 90. Elle fait référence aux moyens de gestion informatique mis en place dans une entreprise pour atteindre ses objectifs stratégiques. C’est avec l’explosion des nouvelles technologies de collecte et de partage d’informations que la définition de nouvelles règles de sécurité afin de garantir la protection des données s’est imposée.

Dans un contexte de mutation digitale, les entreprises témoignent du volume massif de données qu’elles génèrent pour leur course à l’innovation. Cet afflux d’informations mène les entreprises à amorcer une gouvernance tournée vers les données de manière globale et transverse comme un axe stratégique prioritaire.

Nous aimons définir la gouvernance des données comme l’exercice d’une autorité ayant un pouvoir de décision (planification, surveillance et mise en vigueur de règles) et de contrôles sur le management de la donnée.

En clair, elle permet de documenter clairement les différents rôles et responsabilités autour des données ainsi que déterminer les procédures et les outils permettant d’encadrer le management des données au sein d’une organisation.

Les données d’une entreprise sont un « actif partagé » et doivent être traitées comme tel. C’est la raison pour laquelle la gouvernance des données est essentielle. Cet ensemble de pratiques, de politiques, de normes et de guides fourniront une base solide pour s’assurer que les données soient gérées correctement et créent de la valeur au sein d’une organisation.

 

Gouvernance des données : entre contrôle et facilitation ?

Par le passé, les mises en place d’une gouvernance des données au sein des organisations ont rarement été couronnées de succès. Les responsables des données se sont trop souvent concentrés sur la gestion technique ou le contrôle strict des données.

Pour les utilisateurs de la donnée qui aspirent à expérimenter et innover autour des données, la gouvernance peut évoquer un ensemble de restrictions, de limitations et une bureaucratie inutile.

Ils ont des visions effrayantes de données enfermées dans des catacombes sombres, accessibles uniquement après des mois de lutte contre les tracasseries administratives. Pour d’autres, ils se souviennent douloureusement de l’énergie qu’ils ont gaspillée lors des réunions, de la mise à jour des feuilles de calcul et de la maintenance des wikis, pour s’apercevoir que personne ne bénéficiait du fruit de leur dur labeur.

 

Il est évident que les entreprises sont conditionnées par la mise en conformité réglementaire : garantir la confidentialité des données, leur sécurité et assurer une gestion des risques. Toutefois, entreprendre un axe offensif qui tend à améliorer les usages de la donnée d’une entreprise – en garantissant des données utiles, utilisables et utilisées – et valoriser ce patrimoine doit être une démarche capitale.

Une gouvernance des données se pense donc sous deux approches : défensive ou offensive. Il s’agit d’orienter la stratégie d’entreprise vers des exigences IT en termes de sécurité des données ou d’exploitation et d’analyse afin de générer de la valeur business.

Voici, entre autres, les objectifs d’une stratégie de gouvernance des données qui se veut :

 

gouvernance-des-données-defensive

Gouvernance des données defensive

  • Entreprendre une mise en conformité vis à vis des autorités des pays afin d’éviter les sanctions, tel que le Règlement Général sur la Protection des Données (RGPD) mis en application en mai 2018.

  • Répondre aux obligations et règles internes auxquelles sont soumises les données de l’organisation.

  • Assurer la sécurité des données, leur intégrité et leur qualité pour un bon usage.

gouvernance-des-données-offensive

Gouvernance des données offensive

  • Augmenter, à l’aide des données, la profitabilité et la position concurrentielle d’une entreprise.

  • Optimiser l’analyse des données, la modélisation, la visualisation, les transformations et l’enrichissement des données.

  • Augmenter la flexibilité de l’entreprise quant à l’utilisation de ses données.

Que votre secteur d’activité soit très régulé ou fortement concurrentiel, vous serez amené à investir dans une maîtrise parfaite de vos données afin de créer des produits innovants et garder la tête hors de l’eau.

Pourquoi la gouvernance des données est un avantage concurrentiel ?

Pourquoi la gouvernance des données est un avantage concurrentiel ?

Depuis quelques années, sur les traces des GAFA (Google, Apple, Facebook ou Amazon), la donnée est perçue comme un actif crucial pour les entreprises. Ce patrimoine se valorise par des services digitaux et des nouveaux usages disruptant notre quotidien et fragilisant des business plus traditionnels.

Cette transformation, qu’on le veuille ou non, concerne toutes les structures et tous les secteurs. Les entreprises l’ont compris, pour faire face à des startups innovantes et les puisants géants du web, elles doivent capitaliser sur leurs données. Cette prise de conscience amène les grandes – comme les petites – entreprises à démarrer une transformation digitale pour devenir ce que nous appelons Data-Driven.

Être Data-Driven, c’est considérer la donnée comme un actif dans la société qui doit être maîtrisé pour être valorisé.

C’est collecter, maintenir et mettre à disposition un patrimoine de données de qualité et sécurisé. En d’autres termes, les utilisateurs doivent avoir accès à des données exactes, intelligibles, complètes et cohérentes de sorte à détecter des opportunités business avérées, raccourcir le time to market ou encore entreprendre une conformité réglementaire.

La route pour atteindre cette terre promise de l’innovation par la data est parsemée d’obstacles. Entre des données silotées de part et d’autre dans l’entreprise et une connaissance tribale, ce legacy ne contribue en rien à la qualité globale des données.

L’avènement du Big Data a également renforcé le sentiment que le cycle de vie d’une donnée doit être maîtrisé afin de se repérer dans l’afflux et le volume massif de données stockées par l’entreprise. Un défi englobant des rôles et des responsabilités, des process et des outils.

La mise en place d’une telle gouvernance des données est un chapitre que doit écrire une entreprise Data-Driven.

Toutefois, nos expériences, échanges et lectures avec des acteurs du monde de la data ont confirmé notre constat que les démarches de gouvernance des données de ces dernières années n’ont pas tenu leurs promesses

C’est donc à travers nos livres blancs que nous souhaitons partager un éclairage sur ce sujet et être un point de départ dans la construction d’une gouvernance des données “agile”, là où des approches plus traditionnelles n’ont pas su s’organiser et s’adapter dans un environnement en perpétuelle évolution.

 

Nos livres blanc sur la gouvernance des données

Metadata management : une discipline data en plein essor

Metadata management : une discipline data en plein essor

Nous nous sommes rendus les 4, 5 et 6 mars derniers au célèbre Data & Analytics Summit de Londres organisé par Gartner. Un évènement incontournable et inspirant pour les Chief Data Officers et leurs équipes dans la mise en œuvre de leur stratégie data.

Cet article reprend de nombreux concepts de la conférence donnée pour l’occasion : “Metadata Management Is A Must Have Discipline” par Alan Dayley, Gartner Analyst. Ce sujet a su attirer l’attention de plusieurs C-Levels, confirmant que le management de métadonnées est bien une priorité sur les années, voire les mois qui arrivent.

 

La notion de « métadonnée » appliqué à notre quotidien

Pour introduire la notion de métadonnées, le conférencier a fait un parallèle avec une situation que nous connaissons bien et prenant de plus en plus d’importance dans notre quotidien : identifier et sélectionner ce que nous mangeons. Prenons l’exemple des plats préparés aux nombreux aliments transformés aux caractéristiques nutritives largement modifiées. Ce sont grâce à différents labels, barèmes et descriptions sur le packaging du produit que les consommateurs identifient ce que contient leur assiette.

Ces informations sont, ce que nous appelons, des métadonnées !

 

Comment les métadonnées apportent-elles de la valeur à l’entreprise ?

Appliquer des métadonnées sur les données permet ainsi à l’entreprise de contextualiser son patrimoine de données. Regroupées en 4 catégories, les métadonnées abordent différents sujets : Data Trust, Regulations & Privacy, Data Security et Data Quality.

Les réflexions de mise en œuvre d’une stratégie de management de métadonnées se portent sur le juste équilibre entre les besoins métier identifiés dans l’entreprise et les réglementations associées aux risques sur les données.

En d’autres termes, où devez-vous investir du temps et de l’argent ? Démocratiser l’accès aux données pour vos équipes data (data scientists, data engineers, data analysts ou domain experts) en vue de gagner en productivité ou se concentrer sur les demandes des organismes de réglementations comme le RGPD, pour ne pas se voir attribuer une lourde amende ?

La réponse est propre à chaque entreprise. Toutefois, Alan Dayley met en avant les 4 cas d’usage identifiés comme prioritaires par les Chief Data Officers et où un management de métadonnées devrait être la clé :

 

1. Gouverner les données

Dans ce cas d’usage, le speaker confirme que la gouvernance des données ne peut plus être pensée de manière top down. La donnée recoupe différentes équipes et profils aux responsabilités et rôles distincts.

De ce constat, tous doivent travailler ensemble à renseigner et compléter les informations sur la donnée (ses usages, sa provenance, les process, etc.). Contextualiser la donnée est un élément fondamental dans la mise en place d’une gouvernance des données !

 

2. Gérer les risques et la mise en conformité

Les informations demandées ci-dessous ont été renforcées avec l’arrivée du RGPD. Les entreprises et leurs CDO se doivent de :

  • Définir les responsabilités liées aux jeux de données.
  • Cartographier les jeux de données.
  • Comprendre et identifier les traitements sur les données et les risques associés.
  • Avoir un registre de traitements et/ou data lineage.

 

3. Analyser la donnée

En abordant la gouvernance des données de manière plus collaborative et en favorisant les interactions entre utilisateurs de la donnée, l’entreprise bénéficiera de l’intelligence collective et l’amélioration continue sur la compréhension et l’analyse d’un jeu de données. En d’autres termes, c’est extraire des précédentes découvertes et expérimentations des informations pertinentes pour les prochains utilisateurs de la donnée.

 

4. Valoriser la donnée

Dans un objectif de monétisation de la donnée, celle-ci n’aura de valeur à proprement parlé que si l’information autour de la donnée est :

  • mesurée : sur sa qualité, ses caractéristiques économiques, etc.
  • managée : les responsables, documentation renseignée, ses mises à jour, etc.

 

Comment mettre en place un management des métadonnées ?

Quels que soient les objectifs énoncés ci-dessus, vous ne pourrez les atteindre sans un management de métadonnées. Et de fait, les réponses à ces questions sont bel et bien des métadonnées !

Les recommandations pour entreprendre cet exercice seraient :

  • Engager le bon sponsor valorisant l’approche metadata centric dans l’entreprise.
  • Identifier le cas d’usage principal que vous souhaitez traiter en premier (comme défini ci-dessus)
  • Contrôler que les efforts effectués en termes de métadonnées ne sont pas isolés mais bien centralisés et unifiés.
  • Sélectionner un acteur de metadata management solution sur le marché, comme un data catalog.
  • Définir par où, qui et comment vous allez démarrer.

Pour conclure cet article, ne pas avoir un management de métadonnées reviendrait à rouler sur une route sans panneau d’indications. Attention à ne pas vous perdre !

Qui sont les Data Stewards ?

Qui sont les Data Stewards ?

Les transformations digitales font émerger de nouveaux challenges dans l’industrie de la data. On parle de plus en plus de data stewardship ; activité centrée sur la gestion et la documentation des données d’une organisation. Dans cet article, nous souhaitons vous présenter “l’intendant de la donnée”, communément appelé data steward dans les pays anglosaxons. Véritable gardien de la donnée d’entreprise, regardons de plus près son rôle, ses missions et ses outils.

Cet article est un résumé des entretiens effectués avec plus de 25 data stewards dans de moyennes et grandes entreprises françaises. Le but était de comprendre leurs tâches et leurs souffrances dans le management de métadonnées pour apporter des solutions au sein notre data catalog.

Le rôle du Data Steward dans l’entreprise

Les entreprises se réorganisent autour de leurs données pour produire de la valeur et enfin innover depuis cette matière brute. Les data stewards sont là pour orchestrer les données des systèmes data de l’entreprise. Ils doivent assurer la bonne documentation des données et faciliter leur mise à disposition auprès de leurs utilisateurs, tels que les data scientists ou chefs de projets par exemple.

Leurs compétences de communiquant leur permettent d’identifier les responsables et sachants des données, de récolter les informations associées pour les centraliser et pérenniser ces connaissances au sein de l’entreprise. Plus précisément, les data stewards renseignent des métadonnées ; un ensemble structuré d’informations décrivant un jeu de données.  Ils transforment ces données abstraites en assets concrets pour le métier.

Ce métier a le vent en poupe !  Il porte sur des sujets hypes et son rôle social permet au data steward de travailler avec des personnes aussi bien techniques que métier. Le data steward est l’interlocuteur data de référence dans l’entreprise et est le point d’entrée pour accéder aux données. Il possède les connaissances techniques et métier des données, ce qui lui vaut d’être appelé “the master of data” au sein d’une organisation !

 

Les missions du Data Stewards

Son objectif est assez clair, le data steward doit accompagner la gouvernance data des entreprises. Trouver et connaître ses données, imposer une certaine discipline dans le management de la métadonnée et faciliter leur mise à disposition auprès des collaborateurs.

Voilà, entre autres, un certain nombre de sujets que doivent traiter les data stewards. Pour y parvenir, le data steward doit s’assurer que la documentation des données qu’il gère soit bien maintenue. Il est libre de proposer la méthode et le format de documentation technique et métier des données de son choix. 

Ses journées sont rythmées par la recherche des responsables et sachants des données pour enrichir les connaissances qu’il aura récupérées dans un outil exploitable par ses utilisateurs techniques et métier. Ainsi, il veut mettre en relation et faire collaborer les acteurs de projets data afin d’améliorer le partage d’informations et la productivité de tous.

 

Outiller les Data Stewards

Data steward est donc un nouveau métier où ses missions sont encore à clarifier, ses outils à identifier et sa nécessité au sein de l’entreprise à évangéliser. De ce fait, les entreprises ont encore du mal à leur attribuer un budget clair. Il leur est donc difficile de s’outiller correctement pour assurer la bonne maîtrise et gestion de ses données.

Pourtant, bien s’outiller permettrait de :

  • gagner en autonomie sur le management des données,
  • centraliser les informations récoltées sur les données,
  • gérer l’obsolescence de la documentation,
  • faire remonter les erreurs et/ou modifications des données,
  • identifier les données pertinentes à transmettre à ses utilisateurs,
  • exposer les données à ses utilisateurs depuis un outil propice à la collaboration.

Conclusion

À ce jour, nous sommes convaincus que le rôle de data steward est indispensable pour construire et orchestrer une gouvernance data efficiente dans l’entreprise. C’est dans cette direction que s’inscrit en proposant une documentation dynamique et connectée des données de l’entreprise. Autrement appelés data catalogs, ils ont pour ambition de devenir l’outil de référence des data stewards.

Gérer les données d’une manière user friendly. Centraliser l’ensemble des métadonnées recueillies. Ouvrir à ses utilisateurs les données, selon le niveau de sensibilité. Gérer la qualité des données. Le tout en un clic. Etc.

Dans une logique vertueuse, le data catalog apportera de plus en plus de valeur aux utilisateurs de la donnée dès lors que le data steward aura industrialiser l’ajout de métadonnées et la contribution des collaborateurs dans l’outil.

[Infographie] Les 5 piliers d’une gouvernance des données agile

[Infographie] Les 5 piliers d’une gouvernance des données agile

Être data-centric, c’est considérer la donnée comme un actif dans la société qui doit être maîtrisé pour être valorisé. C’est collecter, maintenir et mettre à disposition un patrimoine de données de qualité et sécurisé.

Toutefois, la route pour atteindre la terre promise de l’innovation par la data est parsemée d’obstacles. Entre des données silotées de part et d’autre dans l’entreprise et une connaissance tribale, ce legacy ne contribue en rien à la qualité globale des données.

L’avènement du Big Data a également renforcé le sentiment que le cycle de vie d’une donnée doit être maîtrisé afin de se repérer dans l’afflux et le volume massif de données stockées par l’entreprise. Un défi englobant des rôles et des responsabilités, des process et des outils. La mise en place d’une telle gouvernance des données est un chapitre que doit écrire une entreprise data-centric.

Nos expériences, échanges et lectures avec des acteurs du monde de la data ont confirmé notre constat que les démarches de gouvernance des données de ces dernières années n’ont pas tenu leurs promesses. À travers cette infographie – reprenant les différents points énoncés dans notre livre blanc – nous souhaitons partager un éclairage sur ce sujet et être un point de départ dans la construction d’une gouvernance des données “agile”, là où des approches plus traditionnelles n’ont pas su s’organiser et s’adapter dans un environnement en perpétuelle évolution.

    Nous souhaitions une gouvernance des données ascendante, non invasive, automatisée, collaborative et itérative. En un mot, agile.

    Les articles qui suivent, explicitent les caractéristiques d’une gouvernance des données mise en avant par notre infographie. Elle veut mettre en avant :

    1. Être au plus près de la réalité opérationnelle de votre entreprise.
    2. S’adapter au contexte de votre entreprise et non l’inverse.

    3. Refléter fidèlement votre patrimoine de données.
    4. Fédérer et impliquer vos collaborateurs.
    5. Faire face aux changements rapidement.

    L’organisation d’une gouvernance de données

    En plus de ces 5 attributs, les entreprises doivent penser à l’organisation de cette gouvernance agile des données, et à sa mise à l’échelle.

    Dans notre livre blanc volume 2, nous faisons un état des lieux des organes de gouvernance que nous rencontrons aujourd’hui dans les organisations traditionnelles. Ces derniers sont souvent le produit d’une démarche défensive, héritée du Master Data Management ou d’initiatives plus larges de mise en place d’une gouvernance des systèmes d’information.

    Très centralisés, parfois bureaucratiques, ils se focalisent sur les indispensables fonctions de contrôle et de conformité, au détriment parfois radical de la simplicité d’accès aux données pour les acteurs de l’entreprise.

    Cette dynamique, cependant, n’est pas une fatalité. La conformation des géants du web n’est en effet pas franchement distincte de celle des organisations plus traditionnelles – les contraintes de sécurité et de conformité auxquels ils sont soumis l’exigent. Mais les organes de la gouvernance des données y exercent leur rôle d’une façon radicalement différente. Ils se vivent non comme des gardiens du temple mais comme des facilitateurs dans une organisation où la donnée est un bien commun stratégique. Il apparaît que ce qui les distingue, c’est moins la forme de la gouvernance que la culture qui l’irrigue.

    Cette culture porte un nom : la Data Democracy !

    Gouvernance des données : vers une démarche agile

    Gouvernance des données : vers une démarche agile

    Ces derniers mois, il devient de plus en plus difficile d’assister à une réunion sans entendre l’expression gouvernance des données. Ce sujet n’est pourtant pas nouveau ! Toutefois, avec l’arrivée des technologies Big Data : la donnée et son utilisation deviennent la pierre angulaire des démarches d’innovation. Un vieux sujet évoluant dans un contexte très neuf…

     

    Gouvernance et donnée : l’un ne peut aller sans l’autre

    L’engouement de ces dernières années pour la data est tel que, les entreprises investissent beaucoup de temps et d’argent pour tenter de briser les silos de données et unifier leur patrimoine grâce à de nouvelles infrastructures de stockage toujours plus performantes et moins coûteuses.

    Toutefois, les entreprises ont compris assez vite que la promesse – innover par la donnée – allait être plus compliquée que prévu. Malgré les dernières avancées technologiques, les données sont toujours éparpillées de part et d’autre dans l’entreprise avec un legacy militant. Les nouveaux systèmes de stockage implémentés ne sont – finalement – “que” des stacks techniques supplémentaires dans le paysage SI de l’entreprise et ne permettent pas, à elles seules, de gérer le cycle de vie des données, garantir des règles permettant la bonne utilisation des données et ainsi maximiser la création de valeur des données. Nous parlons ici de gouvernance des données.

     

    Les objectifs d’une gouvernance des données

    En quête d’innovations, les entreprises repensent leurs organisations pour aller vers des organisations “data-driven”.

    Les services informatiques doivent devenir le bras armé du métier en plaçant une donnée raffinée, sécurisée et de qualité au centre des décisions stratégiques.

    Pour atteindre cette transformation, les organisations construisent ce qu’on appelle une gouvernance des données. Ce chantier poursuit des objectifs assez clairs, entre autres :

     

    • Assurer une gestion des métadonnées (techniques, opérationnelles ou encore business) et une documentation de la donnée.

    • Assurer la qualité et l’intégrité des données.

    • Gérer la sécurité des données : encadrer la collecte des données et leur utilisation, surtout quand il est question de données personnelles.

    • Simplifier l’accès aux données et faciliter leur utilisation par un maximum de collaborateurs.

    Une stratégie de gouvernance des données agile

    La manière d’aborder le sujet de la gouvernance des données évolue. Nos expériences nous ont amenés à valoriser une gouvernance des données basée sur les quatre piliers suivants :

     

    • Non invasive et post-hoc : La gouvernance de données ne saurait être un frein à l’innovation dans l’entreprise. Le recueil et l’agrégation des métadonnées sur les jeux de données d’une entreprise, après leur création ou mise à jour par divers pipelines, permet de ne pas interférer avec les propriétaires de ces jeux de données ou leurs utilisateurs.

    • Automatique et connectée : L’automatisation du recueil des métadonnées et des KPIs de gouvernance permet à vos outils de refléter fidèlement la réalité. D’autre part, cette automatisation garantit le maintient à jour d’une telle gouvernance et d’assurer un passage à l’échelle.

    • Bottom-up et collaborative : Une stratégie de gouvernance des données bottom-up veut mettre les individus et leurs interactions devant les processus et les outils. Une démarche de gouvernance de données ne peut être réussie qu’en impliquant l’ensemble des collaborateurs d’une organisation, bénéficiant ainsi de l’intelligence collective.

    • Itérative : Construire par étape une gouvernance des données pour correspondre au plus près aux attentes de l’entreprise et à son fonctionnement. L’adaptation au changement doit être au coeur de la stratégie de gouvernance des données de l’entreprise.

    Une telle approche peut réussir là où de nombreuses initiatives de “data governance” plus importantes ont échoué.

    top down vs bottom up

    Conclusion gouvernance des données agile

    De même que les développements logiciels sont progressivement passés des méthodes traditionnelles (cycle en V, Waterfall, etc.) aux méthodes agiles, la gouvernance des données doit être repensée.

    Une telle démarche non seulement itérative mais incrémentale appliquée à votre stratégie de gouvernance des données permet une plus grande souplesse, nécessaire pour prendre en compte la complexité (croissante) de votre SI.

    L’ajout itératif de données à une structure de gouvernance de données en s’appuyant sur ce qui fonctionne et avancer selon les priorités et use cases stratégiques de l’entreprise est une nouvelle manière d’aborder ce challenge.

     

    Livre blanc : pourquoi une gouvernance des données agile

    La manière d’aborder le sujet de la gouvernance des données évolue. Nos expériences nous ont amenés à valoriser une gouvernance des données basée sur des piliers agiles.

    Retrouvez notre vision et notre démarche de gouvernance des données agile : Définition et bénéfices

    TÉLÉCHARGER

    [Infographie] La maturité des sujets gouvernance des données en France

    [Infographie] La maturité des sujets gouvernance des données en France

    Lors de notre matinée Data Centric Exchange, nous avons eu le plaisir de recevoir une trentaine de Chief Data Officers et Data Managers. Ils ont pu assister au témoignage de Monsieur Jean-Pierre Huchet sur la mise en place d’une organisation data-centric et la construction d’une gouvernance des données au sein du data lake de Renault Digital.

    > Retrouvez la vidéo témoignage : Renault Digital outille sa gouvernance des données.

    Nos petits déjeuners Data Centric Exchange sont les rendez-vous des C-Levels et Managers concernés par les enjeux data au sein de leur organisation. Nos matinées sont un savant mélange de retours d’expériences et de moments d’échanges entre pairs.

    L’occasion de sonder leur maturité sur le sujet Gouvernance des Données dans leur organisation et secteur d’activité. Voici l’infographie qui est ressortie de cette matinée :

    Data lineage : comment cartographier les données de son SI ?

    Data lineage : comment cartographier les données de son SI ?

    Le data lineage est défini comme le cycle de vie des données : origine, transformations et impacts dans le temps. Il offre une plus grande visibilité et simplifie l’analyse des données en cas d’erreurs.

    Avec l’avènement du Big Data et la complexification du SI ; le sujet data lineage devient ainsi un chantier essentiel pour les entreprises centrées sur la donnée. Comment représenter le cycle de vie des données de manière lisible, maintenable avec une certaine granularité dans l’information renseignée ?
    Nous assistons à un changement de paradigme sur la représentation et formalisation de la cartographie des données.

     

    Accèdez à la vidéo de la conférence et les slides

    Ce talk présenté par Matthieu Blanc – VP Product de Zeenea – lors de la conférence DataXDay offre un aperçu et des pistes de reflexion. Pour voir sa conférence et télécharger les slides, ça se passe sur ce lien Conférence data lineage.