Les initiatives business de ces dernières années – nous faisons là bien évidemment référence aux transformations digitales – sont confrontées à une explosion du volume et de la diversité des données. Dans ce contexte, les organisations recherchent davantage de flexibilité et d’agilité dans la gestion de leurs données.

Elles semblent l’avoir trouvé dans des stratégies cloud.

Définition de Data Management

Avant de commencer, définissons ce qu’est la gestion des données et son objectif. Le data management, tel que le décrit TechTarget, est “le processus d’ingestion, de stockage, d’organisation et de maintenance des données créées et collectées par une organisation“. La gestion des données est un élément crucial de la stratégie commerciale et informatique d’une entreprise, et se veut de fournir une aide analytique qui oriente la prise de décision globale des dirigeants.

Comme mentionné ci-dessus, les données sont considérées comme un actif de l’entreprise qui peut être utilisé pour prendre de meilleures décisions plus rapidement, améliorer les campagnes de marketing, augmenter les recettes et les bénéfices globaux et, surtout, innover.

Les futures architectures Cloud du data management

Tout comme nous, vous avez certainement constaté que les hébergements cloud devenaient les technologies par défaut pour la gestion des bases de données de la plupart des fournisseurs. Pourquoi ? Cette technologie semble offrir des avantages indéniables aux équipes de data management :


Un déploiement plus rentable : Une plus grande flexibilité et une configuration plus rapide de leur base de données.
Des dépenses basées sur la consommation : Payez ce que vous utilisez et ne surprovisionnez pas.
Une maintenance plus simple : meilleure maîtrise des coûts et des investissements associés dans le temps. 

En sachant cela, les responsables des données sont de plus en plus nombreux à percevoir le cloud comme une technologie moins coûteuse et scalable, motivant encore plus leur choix.

Dans les années, voire, les mois à venir, le cloud fera partie intégrante du paysage informatique. Toutefois, nous sommes convaincus que le rythme auquel les entreprises migreront vers le cloud variera en fonction de leur taille. Ainsi, les petites et moyennes entreprises migreront plus rapidement, tandis que les grandes entreprises mettront des mois, voire des années, à migrer du fait de leur legacy et des dépendances technologiques …

Cette nouvelle technologie au sein des départements de data management se manifestera sous 3 stratégies principales :

  • Le cloud hybride : Composé de deux ou plusieurs infrastructures Cloud distinctes qui peuvent être privées ou publiques et qui restent des entités uniques 
  • Multicloud : Utiliser l’infrastructure venant de plus d’un fournisseur de services dans le cloud ainsi que des solutions on-premise.
Cloud data-management (1)

Le Cloud devient également une opportunité pour les leaders de l’analyse de données

L’adoption accrue de déploiements de stratégies cloud concernant le data management a des impacts importants pour les stratégies d’analyse des données. Les données se déplaçant vers le cloud, les applications de données et d’analyse utilisées doivent également suivre.

En effet, l’accent mis sur la rapidité de livraison de la valeur a fait des technologies cloud le premier choix pour le développement de nouvelles solutions de gestion et d’analyse des données par les fournisseurs, et pour le déploiement pour les entreprises. Ainsi, les entreprises et les leaders du secteur des données choisiront des solutions de gestion des données nouvelle génération, en version SaaS. Ils migreront leurs actifs en sélectionnant des applications qui se connectent aux futures stratégies cloud et en préparant leurs équipes et leur budget pour les défis à venir qu’ils vont devoir mettre en place.

Les leaders du secteur des données qui utilisent des solutions d’analyse, de business intelligence (BI) et de science des données voient les solutions Cloud comme de plus grandes opportunités pour :

  • Utiliser un environnement de “sandbox” dans le cloud à des fins d’essai en termes d’intégration, d’utilisation, et de connectivité, et créer un environnement d’analyse de prototypage avant d’acheter la solution.
  • Faciliter l’accès aux applications où que vous soyez et améliorer la collaboration des équipes, peu importe où elles se situent.
  • Accéder facilement aux nouvelles fonctionnalités émergentes au fil du temps, grâce à des approches de livraison continue.
  • Soutenir leurs efforts grâce à l’élasticité et à l’évolutivité du cloud tout au long du processus d’analyse des données.

Les data catalogs (ou catalogues de données) sont les nouvelles solutions indispensables des stratégies de data management

Les leaders data s’engagent inévitablement dans le cloud. Or, la gestion, la gouvernance et l’intégration des données vont devenir plus complexes que jamais. Ainsi, les organisations doivent s’équiper de nouvelles solutions de gestion des métadonnées pour faciliter la recherche et l’inventaire des données distribuées dans un écosystème hybride et multi-cloud.  Faute de quoi, les silos de données se multiplieront, ce qui entraînera le déraillement de projets de gestion, d’analyse ou de data science.

Les équipes de data management seront amenées à choisir un data catalog parmi le large éventail de ceux disponibles sur le marché.

Nous aimons définir un catalogue de données comme un moyen de créer et de maintenir un inventaire des actifs de données par la découverte, la description et l’organisation d’ensembles de données distribués.

Si vous-même travaillez sur le projet de catalogue de données, vous trouverez :

  • d’une part par des acteurs assez anciens, initialement positionnés sur le marché de la gouvernance des données.
    Ces acteurs proposent sur place des solutions avec des offres riches mais complexes, dont le déploiement et la maintenance sont coûteux, difficiles et longs, et qui sont conçues pour des équipes de gouvernance transversales. Leur proposition de valeur est axée sur le contrôle, la gestion des risques et la conformité.

  • d’autre part par les fournisseurs d’infrastructures de données (Amazon, Google, Microsoft, Cloudera, etc.) ou de solutions de traitement de données (Tableau, Talend, Qlik, etc.), pour lesquels la gestion des métadonnées est un bloc essentiel pour compléter leur offre. Elles proposent des solutions beaucoup plus pragmatiques (et moins coûteuses), mais sont souvent très techniques et limitées à leur écosystème.

Nous considérons que ces alternatives ne sont pas suffisantes. Voici quelques indications essentielles pour trouver votre futur data catalog. Celui-ci doit :

– être hébergé dans le cloud, permettant des prix plus compétitifs et un retour sur investissement rapide pour votre organisation.

– disposer d’une connectivité universelle, s’adaptant à tous les systèmes et à toutes les stratégies de données (edge, cloud, multi-cloud, cross-cloud, hybride).

– avoir l’automatisation comme caractéristique fondamentale pour la collecte et l’enrichissement des données ainsi que de leurs attributs et liens afin d’enrichir le catalogue et maintenir un référentiel d’informations fiable.
Les mécanismes d’alimentation automatique, ainsi que les algorithmes de suggestion et de correction, réduisent le coût global du catalogue et garantissent la qualité des informations qu’il contient.

– proposer des solutions basées sur l’expérience utilisateur, en particulier pour les utilisateurs dits “métier”, afin d’améliorer l’adoption de la solution.

Cloud data management -2

Pour conclure, les capacités de data management sont de plus en plus souvent orientées cloud, et dans certains cas même principalement dans le cloud.

Les responsables des données souhaitant stimuler l’innovation dans le domaine de l’analyse des données devront tirer parti de cette nouvelle technologie sur leurs ressources de données. Ils devront passer de l’ingestion à la transformation sans oublier d’investir dans un catalogue de données efficace afin de trouver leur chemin dans un monde data toujours plus complexe.

  •  
  •  
  •  
  •