La notion de Data Stewardship est difficile à traduire en français. Littéralement, elle désigne l’intendance des données (ou pour les anciens scouts, l’économat des données). L’idée initiale était de confier à un expert du domaine le soin de qualifier et documenter les données de son univers métier. En effet, les Data Stewards sont ceux qui travaillent au plus près du lieu où les données sont collectées. Ce sont souvent ceux qui comprennent le mieux les différentes dimensions des données et les normes auxquelles elles doivent répondre.
Data Stewardship et gouvernance : les responsabilités
En pratique, le Data Stewardship recouvre un ensemble de responsabilités assez variable, selon la maturité de l’organisation dans laquelle il évolue. Nous catégorisons ces responsabilités dans quatre grandes catégories :
Supervision opérationnelle et qualité
Il s’agit de superviser le cycle de vie complet des jeux de données placés sous sa tutelle. Plus spécifiquement, le Data Steward doit définir voire implémenter les traitements nécessaires à l’acquisition, au stockage et à la distribution des jeux de données.
Il doit également s’assurer que les données produites répondent aux critères de qualité qu’il a définis (valeurs, intervalles, complétude, fraîcheur, etc.) et que des procédures sont en place pour évaluer et au besoin corriger les problèmes éventuels de qualité.
Documentation
Un Data Steward est chargé de définir et de documenter les données, et de construire un glossaire des termes métier applicables. Cela implique s’assurer que chaque élément du jeu de données possède une définition claire, et un usage défini.
La documentation est constituée d’un ensemble de métadonnées techniques et fonctionnelles conformément à un métamodèle en principe commun.
Conformité et gestion des risques
La protection des données, et la gestion des risques réglementaires, est l’un des aspects les plus exigeants du rôle de Data Steward. L’environnement réglementaire autour des données est de plus en plus contraignant et mouvant. C’est au Data Steward de s’assurer que la prolifération des données est encadrée par un ensemble de protocols assurant la conformité avec les normes applicables – notamment en matière de protection de la vie privé.
Sécurité et contrôle d’accès
Enfin, le Data Steward doit définir les règles régissant l’accès aux données, incluant les différents niveaux de confidentialité et les procédures permettant d’autoriser une personne ou un groupe de personne à accéder aux données.
Téléchargez notre livre blanc « Quelle organisation pour une gouvernance des données agile ? »
Orchestrée par un pôle de Data Management, mise en oeuvre par les différentes variantes du Data Steward, la gouvernance des données doit être déployée dans l’organisation. Pour assurer ce déploiement, plusieurs modèles opératoires sont en théorie envisageables – centralisé, fédéré, décentralisé, autonome, facilité, etc. Nous pensons que ce qui les distingue, ce n’est pas la structure de leur gouvernance, mais la culture qui irrigue et anime cette organisation. Cette culture porte un nom : la Data Democracy.