Des outils nécessaires, mais pas suffisants
Chez les utilisateurs des solutions Zeenea, la démocratisation des données et le souhait de basculer vers un modèle décisionnel data-driven sont naturellement des priorités. D’ailleurs, l’accès aux données de ces organisations est partiellement démocratisé puisqu’elles sont toutes équipées d’outils dédiés comme des data lakes et data labs. Naturellement, le déploiement d’un Data Catalog dans ces entreprises en est également l’illustration, avec l’exploitation d’une plateforme unique capable de centraliser tout un patrimoine de données qui est partagé avec l’ensemble des collaborateurs.
Ces outils sont des briques essentielles à toute démarche data-driven, mais ils ne permettent pas à eux seuls de démocratiser l’accès à la donnée. Si l’on prend l’exemple d’un data catalog, l’outil devient particulièrement efficace dès lors qu’il est utilisé par le plus grand nombre dans l’organisation. Ce sont la multiplication des cas d’usages et le travail de documentation des actifs de données par un maximum de collaborateurs qui permettent de libérer la valeur de la mine d’informations de l’entreprise. Chacun à son échelle peut alors bénéficier du travail du collègue, un cercle vertueux en somme. Et pour favoriser cela, un changement culturel est nécessaire.
La culture d’entreprise
Il subsiste parfois au sein des organisations que nous accompagnons un déficit de prise de conscience de la valeur du patrimoine de données à disposition et d’adhésion à la démarche de documentation et de partage des données. Le challenge se situe notamment au niveau de l’usage des outils mentionnés précédemment, avec des données qui restent souvent dans silos entre les différents départements et équipes. Cet état d’esprit est d’autant plus difficile à changer au niveau des métiers, alors que les équipes IT sont culturellement plus sensibilisées et enclines à la documentation et au partage des datas.
Des cellules de gouvernances sont en ce sens créées pour favoriser cette prise de conscience, mais elles souffrent d’un déficit de légitimité dans l’organisation ce qui complique leur travail de sensibilisation au rôle central de la data pour l’entreprise. Dans la littérature du data mesh, il est d’ailleurs conseillé de fédérer / décentraliser la gouvernance de la donnée. Les équipes métiers doivent y être intégrées, au risque qu’un écart de langage se crée : les équipes de gouvernance doivent travailler avec les Data Owners, Data Engineers, Data Analysts, etc. La démocratisation de l’accès aux données doit nécessairement passer par la rencontre entre producteurs et consommateurs de données.
La notion de changement d’état d’esprit dans l’entreprise est une nécessité pour compléter l’outillage en place pour démocratiser la donnée. Les recherches publiées par Gartner montrent qu’historiquement les organisations évoluent dans une culture défensive du “ne jamais partager, sauf” de bonnes raisons de la partager. L’institut de recherche insiste sur la nécessité de basculer sur une philosophie du “toujours partager la donnée, sauf”. Les outils (data lakes, data labs, data catalogs etc.) ne suffisent pas pour démocratiser la donnée s’ils ne sont pas portés par ce changement culturel.
La documentation a posteriori
De nombreux projets sont d’abord guidés par les coûts et les délais, et dans ces cas de figure, la data gouvernance et la data quality ne sont généralement pas des sujets prioritaires dès le départ pour les métiers dans l’organisation. On observe ainsi une tendance à la documentation a posteriori, compliquant la tâche de partage et de documentation. La qualité des données, et a fortiori de sa documentation, sont ainsi trop souvent la dernière roue du carrosse.
Le manque de temps
Le manque de documentation est un biais exacerbé dans les organisations dont le produit et la valeur sont créés via l’exploitation des données. Le frein à la démocratisation est alors plutôt lié au manque de temps pour la documentation qu’à un déficit de culture d’entreprise data-driven comme évoqué plus haut. Si l’on s’appuie de nouveau sur l’exemple du data catalog et du métier de Data Scientist, on observe que ce type de population a plus ou moins l’envie de documenter son activité mais ne prend pas le temps de le faire puisque la complétude du data catalog n’est pas une priorité.
En outre, la documentation et la mise à disposition des données ne sont pas toujours au programme des missions des collaborateurs. Il y a donc aussi une dimension RH pour la démocratisation. La mission de documentation peut être ajoutée au scope des missions des collaborateurs pour favoriser la démocratisation et la responsabilisation.
Le volume des données
Une forme de peur naît parfois lorsqu’il est demandé aux contributeurs de partager leurs propres données métier au sein d’un grand conteneur commun (data lake ou data catalog). Il s’agit de la crainte de se retrouver noyé dans un océan de données ajoutées par d’autres entités de l’organisation, et de ne plus s’y retrouver.
Le data catalog est précieux pour apaiser cette crainte chez les producteurs de données. En effet, l’outil leur offre d’une part la possibilité d’explorer facilement leurs propres données, mais également de se servir de datas produites par d’autres pour leurs propres cas d’usages.
La sécurité des données
L’aspect sécurité revient régulièrement comme un prétexte pour ne pas partager la donnée au sein de l’entreprise. Hors il existe aujourd’hui des systèmes efficaces de gestion des permissions utilisateurs comme celui intégré au data catalog Zeenea par exemple, qui couplé à une culture du partage et de la responsabilisation peuvent permettre de passer outre cette barrière.
La propriété des données
En ce qui concerne la notion de propriété, on observe trop souvent un ownership des jeux de données à un niveau local. Pourtant la donnée est un bien d’entreprise, un patrimoine commun, et seuls des aspects réglementaires devraient justifier une propriété locale. Dans les autres cas, cet ownership devient rapidement un frein à la documentation : la culture d’entreprise doit favoriser la mise à disposition de la donnée au plus grand nombre, sous la responsabilité d’une entité ou d’individus.
Si vous souhaitez échanger avec nous sur les obstacles à la démocratisation des données en entreprise décrits dans cet article, ou si vous souhaitez une présentation des solutions Zeenea à destination des entreprises data-driven :