Un data catalog doit être smart dans l’expérience qu’il propose aux différentes populations d’utilisateurs qui seront amenées à le consommer. En effet, l’un des principaux enjeux du déploiement d’un catalogue de données est son adoption par ceux à qui il est destiné in fine – les consommateurs de datas. Et l’expérience utilisateur joue bien sûr un rôle majeur dans cette adoption.
La notion d’expérience utilisateur dans le domaine du data catalog
La notion d’expérience utilisateur se repose principalement sur l’identification de persona dont on cherche à modéliser le comportement et les objectifs, afin de leur fournir une interface graphique aussi performante et ergonomique que possible. Dans le domaine du data catalog, la caractérisation des personas est problématique, car il n’existe pas d’organisation canonique – il s’agit d’un outil universel, précieux pour des entreprises de toutes tailles, opérant sur virtuellement tous les secteurs d’activité et dans toutes les géographies.
Plutôt que modéliser d’insaisissables personas, il est possible d’aborder le sujet en étudiant l’adoption. Pour cela, on peut distinguer deux grandes populations d’utilisateurs
- Les producteurs de métadonnées, qui vont alimenter le catalogue et monitorer la qualité de son contenu – nous les appellerons de façon générique les Data Stewards ;
- Les consommateurs de métadonnées, qui vont utiliser le catalogue dans le cadre d’un objectif opérationnel lié à leur fonction – nous les appellerons simplement Utilisateurs.
Ces deux populations ne sont bien sûr pas totalement disjointes : certains Data Stewards, polyvalents, sont aussi Utilisateurs.
Les freins à l’adoption du catalogue dans l’entreprise
La vraie valeur d’un data catalog réside dans sa capacité à être adopté largement non par les spécialistes du Data Management, mais par la population beaucoup plus vaste des consommateurs de données (ou de métadonnées).
Cette population est très diversifiée. On y retrouve des experts de la donnée (ingénieurs, architectes, data analysts, data scientists, etc.), des profils métiers (chefs de projets, responsables de domaines, responsables produits, etc.), des spécialistes de la conformité ou du risque. Et plus généralement – dans les organisations les plus matures – tous les responsables opérationnels qui sont amenés à consommer des données pour améliorer leurs performances.
L’adoption du data catalog par ces populations d’Utilisateurs est typiquement freinée par les aspects suivants :
- Pour ces Utilisateurs, l’usage du data catalog est sporadique : ils l’utilisent ponctuellement pour répondre à une question précise, puis utilisent la réponse à leur question dans leur activité opérationnelle. Ils n’ont généralement ni le temps ni l’envie de supporter une courbe d’apprentissage longue sur un outil qu’ils n’utilisent que de façon ponctuelle – il peut s’écouler des semaines entre deux utilisations
- Tous n’ont pas le même prisme sur les métadonnées. Certains seront davantage concernés par les métadonnées techniques, d’autres auront un prisme beaucoup plus sémantique, d’autres encore seront focalisés sur les aspects organisationnels ou de gouvernance.
- Tous ne maîtrisent pas le métamodèle ni l’organisation interne de l’information dans le catalogue. Ils peuvent rapidement se sentir intimidés par une avalanche de concepts potentiellement abscons à leurs yeux.
Le Smart Data Catalog va chercher à adresser ces différents freins pour accélérer l’adoption du catalogue.
Les solutions mises en place par Zeenea pour favoriser l’adoption du catalogue
Le premier élément de réponse tient à l’interface graphique. Nous estimons que les Utilisateurs doivent avoir une courbe d’apprentissage la plus faible possible pour utiliser le catalogue – en pratique, cela signifie qu’ils devraient être en mesure de l’utiliser de façon efficace sans formation préalable. Pour cela, nous avons pris plusieurs décisions.
La première consiste à ne pas proposer la même interface graphique aux Data Stewards et aux Utilisateurs. La solution Zeenea propose deux interfaces :
Zeenea Studio : l’outil de gestion et de monitoring du contenu du catalogue – un outil expert destiné aux Data Stewards.
Zeenea Explorer : qui est destiné aux Utilisateurs – leur propose une expérience de recherche et d’exploration du catalogue la plus simple possible.
Cette approche reprend les principes ergonomiques des solutions de marketplace – qui restent les grands spécialistes de la gestion de catalogue au sens large. Ces solutions proposent typiquement au moins deux applications. L’une, que l’on pourrait qualifier de back-office, permet au personnel de la marketplace (ou à ses partenaires) d’alimenter le catalogue de la façon la plus automatisée possible et de contrôler son contenu pour monitorer sa qualité. L’autre, destinée aux consommateurs, est le plus souvent matérialisée par un site de commerce électronique, et permet aux utilisateurs finaux de rechercher des articles ou d’explorer thématiquement le catalogue. Zeenea Studio et Zeenea Explorer tiennent respectivement ces deux rôles.
Une information hiérarchisée en fonction du rôle de l’utilisateur dans l’organisation
Le second dispositif imaginé par Zeenea est encore au stade expérimental. Il consiste à adapter dynamiquement la hiérarchie de l’information dans la catalogue selon le profil de l’Utilisateur.
En effet, pour un catalogue de données, la hiérarchie de l’information est tributaire du rôle opérationnel de l’Utilisateur. Pour certains, l’information la plus importante sur un jeu de données va être ses caractéristiques techniques : emplacement, sécurité, formats, types, etc. D’autres voudront avant tout connaître la sémantique des données et leur lineage métier. D’autres encore sauront connaître les processus et contrôles qui pilotent la production des données – à des fins réglementaires ou plus opérationnelles.
Le Smart Data Catalog devrait ajuster dynamiquement la structure de l’information pour s’adapter à ces différents prismes.
Enfin, le dernier frein concerne l’organisation de l’information dans le catalogue, qui se matérialise par des axes d’exploration thématiques (un peu comme les rayonnages d’une marketplace). Là aussi, difficile de trouver une structure qui satisfasse toutes les populations d’utilisateurs. Certains chercheront plutôt à explorer le catalogue selon des axes techniques (systèmes, applications, technologies, etc.). D’autres voudront l’explorer selon une classification fonctionnelle – domaines et sous-domaines métier, d’autres encore sous un angle plutôt sémantique à travers un glossaire métier, etc.
La difficulté d’accorder tout le monde sur une classification universelle nous semble insurmontable, et là aussi, le Smart Data Catalog devrait s’adapter à ces différents prismes plutôt que demander aux Utilisateurs de maîtriser une classification qui n’a peut-être pas de sens pour eux. L’expérience utilisateur est donc l’un des facteurs de succès les plus importants pour un catalogue de données.