AirBnB est une entreprise florissante. Face à son expansion rapide, AirBnB avait besoin d’opérer une véritable réflexion autour de la data et de son exploitation. De cette dynamique est né le Data Portal, un outil totalement Data Centric à la disposition des employés.
Cet article est le premier d’une série consacrée aux entreprises Data Centric. Nous mettrons en lumière des exemples réussis de démocratisation et de maîtrise des données au sein d’organisations inspirantes. Ces entreprises précurseurs démontrent l’ambition du data catalog de Zeenea : aider chaque structure à mieux comprendre et utiliser son patrimoine de données.
Airbnb aujourd’hui
En quelques années, AirBnB s’est imposé comme un leader de l’économie collaborative à travers le monde. Son succès en fait aujourd’hui un des premiers hôteliers de la planète.
En chiffres [1], cela représente :
La France est le second marché de l’entreprise derrière les Etats-Unis. Elle compte à elle seule plus de 300 000 logements.
Les réflexions qui ont menées au Data Portal
Lors d’une conférence menée en mai 2017, John Bodley, data engineer chez AirBnB, expose les nouvelles problématiques issues de la forte croissance des collaborateurs (+ de 3500 employés) et de l’explosion du nombre de données, à la fois issues des utilisateurs mais aussi des employés (+ de 200k tables dans leur Data Warehouse). Celui d’un paysage confus et non unifié qui ne permettait pas d’accéder à l’information toujours plus importante.
Comment marier un succès à un problème de gestion bien réel ? Celui de la data. Que faire de toutes ces informations collectées quotidiennement et de ce savoir tant au niveau utilisateur que collaborateur ? Comment les transformer en une force pour tous les employés d’airbnb ? Voici les questions qui ont mené à la création du data portal.
Au-delà de ces enjeux, une problématique de vision d’ensemble s’est imposée à l’entreprise.
Depuis sa création en 2008, AirBnB a toujours porté une grande attention à ses données et leur exploitation. C’est pourquoi, une équipe dédiée s’est mise en ordre de bataille pour développer un outil qui démocratiserait l’accès aux données au sein de l’entreprise. Leur travail s’est à la fois fondé sur la connaissance des analystes et leur capacité à comprendre les points critiques et sur celle des ingénieurs, à même de proposer une vision plus graphique de l’ensemble. Au cœur du projet, un sondage en profondeur des employés et de leurs problématiques a été mené.
De cette enquête est ressortie une constante : une difficulté à trouver les informations dont les collaborateurs avaient besoin pour travailler. La présence d’un savoir tribal, détenu par un certain groupe de personnes, est à la fois contre productif et peu fiable. Résultat : nécessité d’interroger des collègues, manque de confiance en l’information (validité de la data, impossibilité de savoir si les données étaient à jour) et en conséquence, création de nouvelles données « doublon » venant accroître la quantité astronomique déjà existante.
Pour répondre à ces enjeux, AirBnB a créé le Data Portal et l’a présenté au public en 2017.
Data Portal, le data catalog de Airbnb
Pour imager, le Data Portal pourrait se définir comme le croisement entre un moteur de recherche et un réseau social.
Il a été pensé pour centraliser absolument toutes les données recueillies par l’entreprise. Qu’elles proviennent des employés ou des utilisateurs. Le but du Data Portal est de pouvoir restituer ces informations, sous forme de graphiques, à n’importe quel employé qui en aurait besoin.
Ce système en self-service permet aux collaborateurs d’accéder par eux-mêmes aux informations nécessaires au développement de leur projet. Au-delà de la donnée en elle-même le Data Portal permet d’obtenir des métadonnées contextualisées. L’information est fournie avec un background qui permet de mieux valoriser la data et de le comprendre dans son ensemble.
Le Data Portal a été pensé dans une logique collaborative. Dans cette optique, il permet de visualiser, au-delà des données, toutes les interactions entre les différents collaborateurs de l’entreprise. Ainsi il est possible de savoir qui est relié à quelle donnée.
Data Portal, en quelques fonctionnalités
Le Data Portal propose différentes fonctionnalités pour couvrir l’accès aux données de manière simple, ludique et en offrant une expérience utilisateur optimale. On trouve des pages dédiées à chaque jeux de données où un nombre important de métadonnées sont reliées à celles-ci.
Au delà du Data Portal
Démocratiser les données a plusieurs vertus. En premier lieu, cela permet de ne pas créer de dépendance à l’information. Un système en « parapluie » fragilise l’équilibre de l’entreprise. Si l’information et la compréhension des données n’est détenue que par un seul groupe de personnes, le rapport de dépendance devient alors trop fort.
Par ailleurs, il est important de simplifier la compréhension des données pour que les collaborateurs puissent les exploiter au mieux.
Plus globalement, l’enjeu pour AirBnB est aussi d’améliorer la confiance dans les données, pour tous ses collaborateurs. Que chacun puisse être assuré de travailler avec les bonnes informations, mises à jour, etc.
AirBnB n’est pas dupe et l’équipe à l’origine du Data Portal sait que la prise en main de cet outil et son utilisation à bon escient prendront du temps. Chris Williams le dit en ces termes : « Même si demander à un collègue une information est facile, c’est totalement contre productif à plus large échelle ».
Changer ses habitudes, prendre le réflexe de consulter le portail plutôt que d’échanger en direct va demander un peu d’efforts aux collaborateurs.
La vision du Data Portal dans les temps
Pour favoriser la confiance dans les données fournies, l’équipe souhaite créer un système de certification des données. Il permettrait de certifier tant la data que la personne à l’origine de la certification. Du contenu certifié serait mis en valeur dans les résultats de recherche.
Avec le temps, AirBnB souhaiterait faire évoluer cet outil à différents niveaux :
Avec le Data Portal, AirBnB pousse l’exploitation des données au plus haut niveau. La démocratisation à tous les employés permet à la fois de les rendre plus autonomes et efficaces dans leur travail mais aussi de reconstruire la hiérarchie de l’entreprise. Plus transparente, elle devient également moins dépendante.
Le collaboratif prend le pas sur la notion de services dédiés. Et l’exploitation des données renforce la stratégie de l’entreprise, pour son évolution future. Une logique dans laquelle s’inscrit et promeut chez ses clients.
Sources
- [1] https://www.usine-digitale.fr/article/le-succes-insolent-d-airbnb-en-5-chiffres-cles.N512814
- [2] Slides issues de la conférence « Democratizing Data at AirBnB » du 11 mai 2017 : https://www.slideshare.net/neo4j/graphconnect-europe-2017-democratizing-data-at-airbnb
- https://medium.com/airbnb-engineering/democratizing-data-at-airbnb-852d76c51770
- https://www.slideshare.net/neo4j/graphconnect-europe-2017-democratizing-data-at-airbnb
- https://searchcio.techtarget.com/feature/Airbnb-capitalizes-on-nearly-decade-long-push-to-democratize-data
- https://bdam.io/meetups/cask-market-airbnb-dataportal-agile-data-science/
- https://www.youtube.com/watch?v=gayXC2FDSiA
Vous voulez en savoir plus sur les solutions de data discovery ?
Téléchargez notre livre blanc : « Le Data Discovery vu par les Géants du Web »
Dans ce livre blanc, nous faisons un focus sur le contexte et la mise en œuvre des solutions de data discovery développées par les grandes entreprises du web, dont certaines font partie du célèbre «Big Five» ou «GAFAM» (Google, Apple, Facebook, Amazon, Microsoft).