Air France-KLM est le premier groupe en matière de trafic international au départ de l’Europe. La compagnie est membre de l’alliance SkyTeam regroupant 19 compagnies aériennes et offrant un accès à un réseau mondial de plus de 14 500 vols quotidiens vers plus de 1 150 destinations autour du monde. En 2019, Air France c’était :
- 104,2 millions de passagers,
- 312 destinations
- 119 pays,
- 546 avions,
- 15 millions de membres inscrits à leur programme de fidélité “Flying Blue”*,
- 2 300 vols par jour*.
Au Big Data Paris 2020, Eric Poutrin, Lead Enterprise Architect Data Management & Analytics chez Air France, nous a expliqué comment fonctionne une compagnie aérienne, le parcours de leur stratégie big data jusqu’à la mise en place d’une structure Cloud Hybride et où ils en sont aujourd’hui.
Comment fonctionne une compagnie aérienne ?
Avant de commencer à parler data, il est impératif de comprendre comment fonctionne une compagnie aérienne de la création du trajet de vol, à l’atterrissage de l’avion.
Avant de planifier un trajet, la première étape pour une compagnie aérienne telle que Air France est d’avoir un programme de vol. Notez qu’en période de crise sanitaire, ils sont amenés à changer assez fréquemment. Une fois le programme de vol mis en place, il y a trois flux totalement séparés qui se mettent en marche pour qu’un vol ait lieu, avec une date et une heure de départ données :
- le flux des passagers, qui passe par différentes formes de services pour faciliter l’expérience du voyageur dans son parcours, de l’achat des billets sur leurs différentes plateformes (web, app, physique) à la mise à disposition de personnels ou de bornes automatiques dans les différents aéroports pour aider les voyageurs à s’enregistrer, déposer leurs bagages, etc.
- le flux du personnel de bord, avec des profils adaptés avec les qualifications requises pour faire fonctionner ou piloter les avions, ainsi que la gestion des plannings des stewards et hôtesses de l’air.
- le flux ingénierie pour avoir le bon avion avec la bonne configuration au bon point de parking.
Cependant, Eric nous confie que tout cela… c’est dans un monde idéal :
“Le “produit” d’une compagnie aérienne passe par le client, et donc tous les aléas se voient. Puis, tous les aléas de chaque flux impactent les uns les autres ! Donc plus on approche de la date du vol, plus ces aléas deviennent critiques.”
Suite à ces constats, il y a 25 ans maintenant, Air France a décidé de mettre en place une architecture orientée “service,” qui permet de pouvoir, entre autres, la notification des abonnés en cas d’aléas sur n’importe quel flux. Ces notificationsen temps réel sont poussées soit aux agents ou aux passagers en fonction des besoins : la prévention d’aléas techniques (un avion qui tombe en panne), des aléas météorologiques, la prévention des retards, etc.
“L’objectif c’était de franchir la marge entre une approche analytics traditionnelle et une approche analytics moderne axée sur l’analyse omniprésente, prédictive et prescriptive, à grande échelle.” Nous affirme Éric.
La parcours de la stratégie Big Data d’Air France
La chronologie
En 1998, Air France avait commencé par monter un data warehouse d’entreprise sur la partie commerciale rassemblant les données clients, équipages et techniques qui permettaient aux équipes informatiques de la firme de construire des reportings d’analyse.
Eric nous livre qu’en 2001, suite à la crise sanitaire du SRAS (syndrome respiratoire aigu sévère), Air France a dû redéployer des avions suite à l’interdiction de vols entrants aux États Unis. C’est le data warehouse de la firme qui leur a permis de trouver d’autres sources de revenus, grâce leurs algorithmes de machine learning et d’intelligence artificielle. Cette manière de travailler avec la donnée avait bien fonctionné pendant 10 ans et a même permis à la firme de pouvoir surmonter plusieurs autres difficultés, notamment la tragédie du 11 septembre 2001 et la crise de la montée des prix du pétrole.
En 2012, les équipes data d’Air France ont décidé de mettre en place une plateforme Hadoop afin de pouvoir faire des analyses prédictives ou prescriptives (selon les besoins de chacun) en temps réel, car le data warehouse ne répondait plus à ces nouveaux besoins et à la forte volumétrie d’informations à gérer. C’est seulement en quelques mois après l’implémentation d’Hadoop, de KAFKA, et d’autres technologies nouvelle-génération que la firme a pu réussir à avoir des données beaucoup plus “fraîches” et pertinentes.
Depuis, les équipes améliorent et optimisent constamment leur écosystème data afin de toujours pouvoir être à jour avec les nouvelles technologies et donc, permettre aux utilisateurs data de travailler efficacement avec leurs analyses.
Les défis data d’Air France
Durant la conférence, Éric nous a également présenté les défis data de la firme dans la mise en place d’une stratégie data :
- Délivrer un écosystème analytics fiable avec des données de qualité,
- Mettre en place des technologies adaptées pour tous les profils et adaptées pour les cas d’usage de chaque secteur d’activité,
- Avoir une infrastructure qui supporte tous types de données en temps réel.
Air France a pu résoudre certaines de ces problématiques grâce à la mise en place d’une architecture robuste (qui a notamment permis à la firme de pouvoir résister à la crise du COVID-19), ainsi que la mise en place d’équipes dédiées, le déploiement d’applications et la structure de sécurité lié notamment au RGPD et autres réglementations pilotes.
Cependant, Air France KLM n’a pas fini de travailler pour atteindre ses défis data. Avec des volumes de données qui ne cessent de croître, le nombre d’utilisateurs data et métier qui augmente, la gestion des flux de données à travers les différents canaux de l’entreprise et la gestion des données, c’est un travail de gouvernance constant :
“Il faut toujours qu’on soit au service des métiers, et comme les gens et les tendances changent, il est impératif de faire des efforts continus pour que tout le monde puisse comprendre la donnée.”
L’architecture data unifiée d’Air France
L’unified data architecture (UDA) est la pierre angulaire d’Air France. Éric nous explique qu’il y a quatre types de plateformes :
La plateforme de data discovery
Séparée en deux plateformes différentes, elles sont les applications de prédilection des data scientists et citizen data scientists. Elles permettent, entre autres, de :
- extraire la “connaissance” de la donnée,
- traiter des données non-structurées, (des textes, des images, des voix, etc.)
- avoir un support d’analyse prédictive afin de comprendre les comportements des clients
Un data lake
Le data lake d’Air France est une instance logique et est accessible à tous les employés de l’entreprise, qu’importe le métier. Attention, Eric précise que les données sont bien sécurisées : “Le data lake n’est pas un open bar du tout ! Tout est fait sous le contrôle des data officers et data owners”. Le data lake :
- stocke les données structurées et non-structurées,
- combine les différentes sources data provenant de métiers variés,
- permet d’avoir une vision complète d’une situation, un topic ou un environnement data,
- est très scalable.
Des plateformes “Real Time Data Processing”
Pour opérer les données, Air France a implémenté 8 plateformes de data processing en temps réel afin de répondre aux besoins de chaque “grand” cas d’usage métier. Par exemple, ils ont une plateforme pour la maintenance prédictive, la connaissance comportement client, ou encore l’optimisation processus en escale.
Eric nous confirme que lorsqu’un évènement ou aléa survient, leur plateforme est capable de pousser des recommandations sous la forme de notifications en “real time” en seulement 10 secondes !
Des Data Warehouses
Comme précisé ci-dessus, Air France avait également déjà mis en place des data warehouses pour stocker les données externes telles que les données clients, partenaires et les données des systèmes opérationnels. Ces Data Warehouses permettent encore aux utilisateurs de faire des requêtes sur ces jeux de données en toute sécurité, et sont un excellent vecteur de communication pour expliquer la stratégie data entre les différents métiers de l’entreprise.
L’intérêt de la mise en place d’une architecture Cloud Hybride
Les questions initiales d’Air France par rapport à la bascule vers le Cloud étaient :
- Air France KLM vise à standardiser au maximum ses services de calcul et de stockage
- Toutes les données ne sont pas éligibles à la sortie des locaux d’Air France en raison de réglementations ou de données sensibles
- Tous les outils déjà exploités dans les plateformes UDA sont disponibles à la fois on-premise et dans le cloud public
Éric soutient qu’une architecture Cloud hybride permettrait à la firme d’avoir plus de souplesse pour répondre aux challenges actuels :
“Mettre notre UDA sur le Cloud publique donnerait une meilleure flexibilité aux métiers et plus d’options en terme de déploiement data.”.
Selon Air France, voici la check liste des bonnes pratiques à vérifier avant de faire un migration vers le Cloud Hybride:
- vérifier si la donnée a une bonne raison d’être migrée vers le Cloud public
- vérifier le niveau de sensibilité de la donnée (selon les politiques de data management internes)
- vérifier la conformité des directives de mise en œuvre du UDA
- vérifier les designs des flux de données
- configurer la bonne connexion réseau
- pour chaque outil d’implémentation, choisir le bon niveau de service management
- pour chaque composant, évaluer le niveau de verrouillage et les conditions de sortie
- monitorer et prévoir les éventuels coûts
- adopter un modèle de sécurité qui permet la sécurité du Cloud Hybride d’être le plus transparent possible
- étendre la gouvernance des données sur le Cloud
Air France aujourd’hui, où en sont-ils ?
Il est évident que la crise du COVID-19 a complètement changé le secteur de l’aviation. Chaque jour, Air France doit prendre le temps de comprendre les nouveaux comportements des passagers et adapter les programmes de vol en temps réel, en accord avec les restrictions de voyage mis en place par les différents gouvernements. D’ici la fin de l’été 2020, Air France aura desservi près de 170 destinations, soit 85% de leur réseau habituel.
L’architecture data d’Air France a donc été un catalyseur clé pour la reprise de leurs compagnies aériennes :
“un grand bravo à nos utilisateurs métiers (data scientists) qui chaque jour essaient d’optimiser en temps réel les services afin de pouvoir comprendre comment les voyageurs se comportent en pleine crise sanitaire. Même si nous travaillons sur l’intelligence artificielle, l’humain est quand même une ressource essentielle dans le succès d’une stratégie data.”