”There aren’t enough expert data scientists to meet data science and machine learning demands, hence the emergence of citizen data scientists. Data and analytics leaders must empower “citizens” to scale efforts, or risk failure to secure data science as a core competency”. – Gartner 2019
Les efforts et investissements dans la data science ont battu tous les records en 2019 ! La demande de data scientists est donc plus forte que jamais. Cependant, la demande est bien plus élevée que l’offre actuelle sur le marché. Les entreprises se retrouvent à se battre pour leur place, et dans certains cas, pour leur survie.
En réponse à ce challenge, un rôle analytique important a été créé pour faire le lien entre les data scientists et les fonctions métiers : le citizen data scientist.
Qu’est-ce qu’un citizen data scientist ?
Gartner définit le concept du citizen data scientist comme « un ensemble de capacités et de pratiques qui permet aux utilisateurs d’extraire des informations prédictives et normatives sur les données sans avoir besoin d’être aussi qualifiés et techniquement sophistiqués que les data scientist experts« . Attention, un « citizen data scientist » n’est pas un poste. Il s’agit d’un « power user » qui peut effectuer des tâches analytiques simples.
En règle générale, les citizen data scientists n’ont pas de compétences en codage. Néanmoins, ils peuvent construire des modèles en utilisant des outils de “drag and drop” et faire fonctionner des data pipelines ainsi que des modèles pré-construits à l’aide d’outils tels que Dataiku. Les citizen data scientists ne remplacent pas les data scientists experts ! Ils apportent leur propre expertise mais n’ont pas les compétences techniques pour la data science avancée.
Le citizen data scientist est un rôle qui a évolué comme une « extension » d’autres rôles au sein de l’organisation. Cela signifie que les organisations doivent créer la fiche persona du citizen data scientist. Le potentiel des citizen data scientists varie en fonction de leurs compétences et de leur intérêt pour la data science et du machine learning. Les rôles qui entrent dans la catégorie du citizen data scientist sont les :
- Business analysts
- BI Analysts / Developers
- Data Analysts
- Data Engineers
- Application Developers
- Business line manager
Conseils pour la construction de votre équipe de citizen data scientists
Comme les compétences d’experts en data science ont tendance à être assez coûteuses et difficiles à obtenir, le recours à un citizen data scientist peut être un moyen efficace de combler ce manque.
Voici comment vous pouvez renforcer les capacités de vos équipes de data science :
Briser les silos d’entreprises
Comme vous l’avez déjà entendu à maintes reprises, de nombreuses organisations ont tendance à fonctionner de manière indépendante. Comme mentionné ci-dessus, tous les rôles sont importants dans la stratégie de gestion des données d’une organisation, et ils ont tous exprimé leur intérêt pour monter en compétence en data science et machine learning. Cependant, la plupart de ces connaissances sont gardées par des départements ou rôles spécifiques. Par conséquent, les efforts de data science sont souvent invalidés et non-exploités. Le manque de collaboration entre les différents rôles rend difficile le travail des citizen data scientists !
En établissant une communauté de rôles business et informatiques qui fournit des lignes directrices et/ou des ressources détaillées, les entreprises peuvent donner aux citizen data scientists les moyens d’accéder et comprendre leurs données. Il est donc important pour les entreprise d’encourager le partage des efforts de data science dans toute l’organisation et ainsi, de briser les silos data !
Fournir une technologie de data analytics augmentée
La technologie alimente la montée en puissance du citizen data scientist. Les fournisseurs traditionnels de BI, tels que SAP, Microsoft et Tableau Software, ont des fonctionnalités qui permettent l’analyse statistique et prédictive avancée. Parallèlement, les plateformes de data science et de machine learning telles que SAS, H2O.ai et TIBCO Software, fournissent aux utilisateurs qui ne disposent pas de capacités d’analyse avancées, des « analyses augmentées ». L’analyse augmentée s’appuie sur du machine learning automatisé pour transformer la manière dont le contenu analytique est développé, consommé et partagé. Elle comprend :
La préparation de données augmentée : l’automatisation de machine learning pour augmenter le profilage, la qualité, la modélisation, l’enrichissement et le catalogage des données.
La découverte de données augmentée : permet aux utilisateurs business et techniques de trouver, visualiser et analyser de manière automatique les informations pertinentes à leurs usages telles que des corrélations, des groupes, des segments et des prédictions, sans avoir à construire des modèles ou à écrire des algorithmes.
La data science et le machine learning augmentés : l’automatisation des aspects clés de la modélisation analytique avancée, tels que la sélection des caractéristiques, la sélection des algorithmes et les processus d’étapes qui prennent du temps.
En intégrant les outils et les solutions nécessaires et en augmentant les ressources et les efforts, les entreprises peuvent désormais construire leur équipe de citizen data scientists !
Donner aux citizen data scientist les moyens de gérer leurs données grâce à une plateforme de gestion des métadonnées
La gestion des métadonnées est une discipline essentielle pour les entreprises qui souhaitent soutenir l’innovation ou les initiatives de conformité réglementaire sur leurs actifs de données. En mettant en œuvre une stratégie de gestion des métadonnées, dans laquelle les métadonnées sont bien gérées et correctement documentées, les citizen data scientists sont en mesure de trouver et d’extraire facilement des informations pertinentes à partir d’une plateforme intuitive.
Découvrez nos conseils pour démarrer un metadata management en seulement 6 semaines en téléchargeant notre nouveau livre blanc « Le guide du metadata management« .