Les 28 et 29 septembre derniers, nous avons assisté à de nombreuses conférences lors du Big Data & AI Paris au Palais des Congrès. Une de ces conférences a particulièrement attiré notre attention autour d’un sujet très tendance : la data literacy.
Dans cet article, nous vous présenterons les bonnes pratiques en matière de data literacy que Jennifer Belissent, Analyst chez Forrester et Data Analyst chez Snowflake, nous a partagées. Elle détaille aussi les raisons pour lesquelles cette pratique est essentielle pour une gouvernance des données efficace.
L’entreprise “data-driven”
Ce n’est pas un secret, aujourd’hui toutes les entreprises veulent devenir “data-driven”. Et la data, tout le monde la recherche ! En effet, elle n’est plus réservée à une personne ou une équipe experte en particulier, mais à tous les départements de l’organisation. Du reporting aux analyses prédictives, jusqu’à la mise en place d’algorithmes de machine learning, les données doivent être présentes dans les applications et processus de l’entreprise pour sortir des informations directement pour les prises de décision stratégiques de l’organisation.
Pour ce faire, Jennifer précise : “Il faut briser les silos partout dans l’entreprise ! Il faut donner accès aux données internes bien sûr, mais il ne faut pas négliger les données externes, comme les données de fournisseurs, de clients et de partenaires. On s’en sert et aujourd’hui on en est même dépendant”.
Qu’est-ce que la data literacy ?
La Data literacy ou culture des données, est la capacité d’identifier, de collecter, de traiter, d’analyser et d’interpréter des données afin de comprendre les phénomènes, les processus, les comportements qui les ont générées.
Hors beaucoup d’employés souffrent d’un manque de connaissance sur le sujet de la data et des analytics associées, car ils ne reconnaissent pas ce que sont les données et la valeur qu’elles apportent à l’entreprise. Mais chaque employé a un rôle à jouer. Pour mieux gouverner, il faut établir un programme de data literacy.
Le challenge de la gouvernance des données
Le patrimoine de données colossal d’une organisation doit être géré et gouverné correctement afin d’en tirer un maximum de valeur. Jennifer nous présente les trois défis majeurs chez Snowflake :
- La donnée est partout : qu’elles soient dans les systèmes d’analyse, dans les emplacements de stockage, ou dans des fichiers Excel, il est difficile de connaître toutes les données de l’entreprise si elles ne sont pas partagées.
- La gestion des données est complexe : il est difficile de gérer toutes ces données de provenances variées. Où est la donnée ? Que contient-elle ? Qui en est le propriétaire ? Les réponses à ces questions nécessitent la mise en place d’une visibilité et d’un contrôle centralisés.
- La sécurité et la gouvernance sont rigides : la sécurité des données est très souvent liée aux silos data de l’organisation. Pour sécuriser et gouverner ces datas, il est nécessaire d’avoir une politique unifiée, cohérente et flexible.
Mais ce n’est pas tout ! Il existe bel et bien un quatrième défi : le manque de data literacy.
Les conséquences du manque de data literacy dans l’organisation
Pour bien illustrer ce qu’est la data literacy, Jennifer nous raconte une anecdote. Début 2020, lors du premier confinement en France, Jennifer échangeait avec la Chief Data Officer de chez Sodexo. La CDO racontait à Jennifer que lors d’une analyse de données liées à leur site internet, un fait intéressant ressortait : un pic d’achat de saucisses le matin.
Cela a surpris la CDO qui trouvait cette hausse des ventes de saucisses étrange, sachant que les “breakfast sausages” n’étaient pas un petit déjeuner habituel pour les Français ! En creusant un peu, elle a découvert que ce pic de ventes correspondait au moment où Sodexo avait remplacé les caisses traditionnelles en points de ventes par des bornes automatiques. Ces bornes disposaient de boutons correspondant à chaque article afin de mieux gérer les commandes. Le problème était alors identifié : l’hôte de caisse chargé de ces nouvelles bornes n’avait aucune idée de ce que ces boutons représentaient et appuyait constamment dessus, sans savoir qu’en réalité elles captaient des données ! Heureusement que Sodexo s’en était aperçu, sans cela l’entreprise aurait commandé un énorme stock de saucisses…
Suite à cette histoire, Jennifer raconte qu’elle a réalisé avec Forrester une étude qualitative en posant trois questions :
- Est-ce que vous travaillez avec les données ?
- Est-ce que vous êtes à l’aise avec les données ?
- Si non, quelles formations pourraient vous aider à vous sentir plus à l’aise avec les données ?
Les réponses à ces questions ont été surprenantes ! En effet, Jennifer raconte que Forrester pensait que la question la plus importante de l’étude serait la dernière. Or, c’était en fait les réponses à la première question qui les a surpris : beaucoup des personnes répondaient qu’ils ne travaillaient pas du tout avec de la donnée car “ils ne travaillaient pas avec des tableurs ou des calculs”.
D’un autre côté, ceux qui répondaient qu’ils étaient à l’aise avec les données avaient un gros manque de confiance vis-à-vis de leurs collègues : ces personnes étaient les seuls à comprendre les données et donc s’inquiétaient des erreurs que leurs collaborateurs pourraient faire.
“Il y avait donc deux gros problèmes liés aux données : obtenir des données utiles et fiables, mais surtout la plupart des personnes de cette étude ne savaient même pas qu’elles travaillaient avec la data !” précise Jennifer.
Le manque de data literacy nuit à la gouvernance des données
La définition de data literacy, selon Jennifer, est donc une personne capable de lire, comprendre, créer et communiquer des données. Mais Jennifer ne trouve pas cela suffisant : “Il faut également être en mesure de reconnaître les données. Comme on l’a vu, beaucoup de personnes ne savent pas ce que sont les données aujourd’hui”.
Pour beaucoup, la gouvernance des données est uniquement associée à la sécurité. Mais en réalité, la gouvernance s’étend sur toute la chaîne de valeur et sur tout le cycle de vie de la donnée ! Il y a trois piliers de la gouvernance des données selon Jennifer :
- Connaître les données : comprendre, classer, suivre les données et leur utilisation, en connaître les propriétaires, savoir si elles sont de bonne qualité, si elles sont sensibles, etc.
- Protéger les données : sécuriser les données sensibles grâce à des contrôles d’accès basés sur des politiques internes et des réglementations externes.
- Libérer les données : véhiculer le potentiel des données et permettre aux équipes de les partager .
Et autour de ces trois piliers vient la data literacy ! La gouvernance des données sera améliorée grâce à une meilleure connaissance des données.
Les bonnes pratiques en matière de data literacy
La mise en place d’un programme de data literacy ne doit pas être réservée uniquement aux experts, et doit même commencer tout en bas de la pyramide ! Ce dès le processus d’onboarding d’un nouvel arrivant dans la société, par exemple.
Jennifer propose aux entreprises qui souhaitent devenir data-driven de s’appuyer sur un programme de data literacy répondant à 4 objectifs :
- Sensibiliser : sensibiliser tous les employés sur ce qu’est une donnée, leur intérêt, le rôle de chacun vis-à-vis des données et surtout la valeur qu’elles apportent pour l’entreprise.
- Améliorer la compréhension : ceux qui sont censés utiliser les données dans l’entreprise ont souvent peur, et ne les comprennent pas toujours. Il est donc important de leur fournir les bons outils, les aider à se poser les bonnes questions et expliquer la logique des analyses afin que ces utilisateurs puissent prendre de meilleures décisions.
- Enrichir l’expertise : cela se traduit par la mise en place des meilleurs outils et pratiques techniques, mais il s’agit également de les exploiter.
- Permettre le passage à l’échelle : c’est grâce aux experts data de votre entreprise que vous allez pouvoir permettre le passage à l’échelle et donc, aider à créer une communauté et une culture data. Il est important que ces experts transmettent leurs connaissances à toute l’entreprise.
Pour conclure, Jennifer nous partage une dernière analogie :
”Pour les entreprises data-driven, la gouvernance des données est le code de la route, et la data literacy en est la base”.