Août 2020 Zeenea Product Spotlight
- Release
Alors que l’application Studio de Zeenea facilite le quotidien des Data Stewards dans l’administration et la maîtrise des données (import, complétion, maintenance, etc.), la nouvelle application Explorer de Zeenea s’adresse directement aux équipes data, les consommateurs finaux des données en entreprise.
L’objectif de cette nouvelle application ? Faciliter la vie des équipes data en leur permettant de rechercher et de découvrir rapidement et simplement les informations internes présentes sur les données de leur entreprise (voir nos connecteurs) ou issues de l’open data.
Au travers de cette nouvelle application Explorer, Zeenea cherche à adresser toujours plus finement les utilisateurs finaux de la données en entreprise dans chacun de leurs usages et besoins au quotidien.
Pour ce lancement, Zeenea s’est particulièrement intéressé aux Data Scientists pour mieux adresser leurs besoins de découverte et d’appréhension (à la fois métier, statistique et technique) des données en entreprise.
Les atouts de l’Explorer ?
- Un design adapté aux besoins de recherche et de consultation,
- Le data profiling, les principales informations statistiques présentes sous forme de graphiques et très utiles pour une lecture analytique synthétique,
- Des pages de détail qui facilitent la lecture et le partage de connaissances.
Dans cette première release, découvrez les premières fonctionnalités disponibles pour vos consommateurs de données :
1. Un design adapté aux besoins de recherche et de consultation
Une recherche rapide adaptée aux besoins utilisateurs
Accessible dès la homepage et présente à tout au long de la navigation, les utilisateurs peuvent à tout moment utiliser la recherche pour exprimer leurs besoins.
Ils retrouvent alors directement leurs recherches précédentes ainsi que des suggestions de résultats portant sur les objets du catalogue les plus pertinents.
Des filtres faciles d’accès
Pour convenir aux besoins des Data Scientists dans leurs premières étapes de discovery, les filtres principaux à disposition leur permettent de cibler rapidement le type d’objets souhaités, leur qualité et leurs sources avant de leur proposer l’ensemble des possibilités de filtrage disponibles.
Sur la page de résultats, 4 filtres principaux sont directement accessibles pour sélectionner :
- Un ou plusieurs type(s) d’objet(s) présents au sein du catalogue (jeux de données, champs, visualisations, traitements)
- Un ou plusieurs connecteurs (selon les données importées)
- La qualité des objets (certains objets sont déclarés comme étant de bonne qualité et peuvent donc être utilisés sereinement alors que d’autres demandent plus de vigilance)
- La récence des objets (l’utilisateur peut choisir la période observée qui se réfère à la date de mise à jour de l’objet)
- Les autres propriétés paramétrées via le Studio et nécessaires au filtrage sont alors regroupées dans un dernier filtre présenté sous la forme d’un panneau dépliant.
- Dans les filtres, les utilisateurs peuvent saisir les valeurs recherchées pour toujours plus de facilité.
Une hiérarchie d’information travaillée pour satisfaire les besoins d’information à chaque étape des investigations,
Directement depuis la page de résultats, les Data Scientists accèdent à une vue avancée des objets du catalogue. Propres à leurs besoins, ils ont alors un regard sur les métadonnées sources et techniques qu’ils ont l’habitude de (re)connaître ainsi que les spécificités métier données documentées par les équipes de Data Steward.
Cet aperçu résume les informations essentielles sur les objets telles que les noms logiques, noms techniques, les contacts, les métadonnées sources et toutes les informations nécessaires sur les objets. Cela éviter à l’utilisateur de devoir parcourir chacune des pages de détail afin de trouver l’information recherchée.
Dès cet aperçu, les utilisateurs peuvent réaliser des actions telles que rechercher un champ sur un dataset ou encore un dataset à l’origine d’une visualization.
Pour résumer, l’étape de discovery des données est optimisée pour permettre aux Data Scientists (et plus largement aux équipes data) de gagner en productivité dès la recherche.
2. Le Data profiling : une synthèse statistique des données présentes dans les colonnes des datasets
Autorisé ou non par le Data Steward depuis le Studio, cette fonctionnalité offre aux équipes data, depuis Zeenea Explorer, un aperçu des données présentes dans un jeu de données.
Pour chacune des colonnes, une vue des statistique est disponible.
Les valeurs principales issues d’un échantillon du dataset et remontées via les connecteurs (BigQuery, Pgsql, etc.) sont affichées et représentées sous forme visuelle au travers graphiques.
Proportion de données manquantes, valeurs distinctes, médianes, distributions des données, valeurs principales, etc. sont représentées dans des graphiques et permettent à l’utilisateur d’appréhender rapidement le contenu des fields (colonnes) de type chaînes de caractères et valeurs numériques.
3. Des pages de détail qui facilitent la lecture et l’échange de savoir
Les pages de détails des objets présentent l’intégralité de l’information de chacun des objets du catalogue (jeux de données, champs, visualizations, traitements).
En haut de la page, les éléments principaux constitutifs de l’objet sont concentrés en synthèse de l’élément. Le détail est ensuite présenté au sein d’onglets dédiés.
L’onglet “questions & réponses” permet aux utilisateurs de s’exprimer sur l’objet et de faire appel à la communauté pour obtenir des informations supplémentaires et spécifiques à son besoin. Ceci permet de développer la collaboration au sein de l’outil mais surtout d’inscrire le savoir lié aux objets dans le temps afin de toujours mieux partager la connaissance sur les données en entreprises.
Prochainement sur Zeenea Explorer :
L’objectif des prochains sprints sera d’agrémenter la recherche directe avec des étapes d’explorations plus poussées.
Nos efforts porteront sur la création de “chemins d’exploration” qui permettront aux équipes data de découvrir et d’être guidés dans la découverte des éléments du catalogue.
Paramétrables depuis le Studio, le back office du Data Catalog, ces chemins s’adapteront aux utilisateurs de Zeenea Explorer et leur apporteront une lecture plus pertinente des actifs mis à leur disposition dans Zeenea.
L’objectif ? permettre une navigation encore plus fluide et plus profonde grâce à des liaisons directes entre les niveaux d’informations.