Tout savoir sur les Data Contracts

Tout savoir sur les Data Contracts

Dans le monde data-driven d’aujourd’hui, les entreprises échangent de vastes volumes de données entre différents départements, services et écosystèmes partenaires à partir de diverses applications, technologies et sources. Assurer que les données échangées sont fiables, de haute qualité et dignes de confiance est vital pour générer de la valeur tangible. C’est là que les Data Contracts entrent en jeu – similaires aux contrats traditionnels qui définissent les attentes et les responsabilités, les Data Contracts servent de cadre pour un échange de données fiable.

Dans cet article, apprenez tout ce que vous devez savoir sur les Data Contracts !

Qu’est-ce qu’un Data Contract ?

 

Un Data Contract est essentiellement un accord entre deux parties ou plus concernant la structure, le format et la sémantique des données échangées. Il sert de plan directeur qui définit comment les informations doivent être organisées, encodées et validées pendant le processus de communication. De plus, un aspect crucial d’un DataContract implique de spécifier comment et quand il doit être livré pour garantir la fraîcheur des données échangées. Idéalement, ils devraient être fournis au début de tout accord de partage, établissant des lignes directrices claires dès le départ tout en assurant l’alignement avec l’évolution du paysage réglementaire et les avancées technologiques.

Les Data Contracts servent généralement de pont entre les producteurs de données, tels que les software engineers, et les consommateurs de données, tels que les data engineers ou scientists. Ces contrats détaillent méticuleusement comment les données doivent être structurées et organisées pour faciliter leur utilisation par les processus en aval, tels que les pipelines de données. L’exactitude des données devient essentielle pour éviter les problèmes de qualité et garantir la précision des analyses.

Pourtant, les producteurs de données peuvent manquer d’informations sur les exigences spécifiques et les informations essentielles nécessaires par chaque type d’organisation d’équipe data pour une analyse efficace. En réponse à cette lacune, les Data Contracts sont devenus indispensables. Ils fournissent une compréhension partagée et un accord concernant la propriété, l’organisation et les caractéristiques des données, facilitant une collaboration plus fluide et une utilisation plus efficace à travers diverses équipes et processus.

Il est important de souligner que les Data Contracts sont parfois séparés des accords de partage de données. Alors que les Data Contracts détaillent les spécificités techniques et les obligations légales inhérentes à l’échange de données, les accords de partage fournissent une version simplifiée, souvent sous forme de documents Word, spécialement conçus pour les parties prenantes non techniques comme les Data Protection Officers (DPO) et les conseillers juridiques.

Que contient un Data Contract ?

 

Un Data Contract comprend généralement des accords sur :

La sémantique

 

La sémantique dans un Data Contract clarifie la signification et l’utilisation prévue des éléments et champs de données, assurant une compréhension mutuelle entre toutes les parties. Une documentation claire fournit des orientations sur le format, les contraintes et les exigences, favorisant la cohérence et la fiabilité entre les systèmes.

Le Modèle de Données (Schéma)

 

Le schéma dans un Data Contract définit la structure des jeux de données, y compris les types de données et les relations qui les lient. Il guide les utilisateurs dans la manipulation et le traitement des données, assurant la cohérence entre les systèmes pour une intégration transparente et une prise de décision efficace.

Les accords de niveau de service (SLA)

 

La partie SLAs d’un Data Contract établit des normes convenues pour les services liés aux données afin de garantir leur fraîcheur et leur disponibilité. Il définit des métriques telles que les temps de réponse, le temps de disponibilité et les procédures de résolution des problèmes. Les SLAs attribuent des responsabilités aux deux parties, garantissant que les niveaux de service sont respectés.

La gouvernance des données

 

Dans le Data Contract, la gouvernance des données établit des lignes directrices pour une gestion des données responsable. Elle clarifie les rôles et les responsabilités, garantissant la conformité aux réglementations et favorisant la confiance entre les parties prenantes. Ce cadre aide à maintenir l’intégrité et la fiabilité des données, en alignement avec les exigences légales et les objectifs au niveau organisationnel.

La qualité des données

 

La section sur la qualité des données d’un Data Contract garantit que les données échangées répondent à des normes prédéfinies, y compris des critères tels que l’exactitude, l’exhaustivité et la cohérence. En spécifiant les règles de validation des données et les protocoles de gestion des erreurs, le contrat vise à maintenir l’intégrité et la fiabilité des données tout au long de leur cycle de vie.

La sécurité et confidentialité des données

 

La partie sur la sécurité et la confidentialité des données d’un Data Contract décrit les mesures pour protéger les informations sensibles et garantir la conformité aux réglementations sur la confidentialité. Elle comprend des politiques de chiffrement, des contrôles d’accès et des audits réguliers pour protéger l’intégrité et la confidentialité des données. Le contrat met l’accent sur la conformité aux lois telles que le RGPD, la HIPAA ou le CCPA pour protéger les droits à la vie privée des individus et instaurer la confiance entre les parties prenantes.

Voici un exemple de Data Contract provenant du PayPal’s open-sourced Data Contract :

Paypal Opensource Data Contract Example

Qui sont les responsables des Data Contracts ?

 

La création de Data Contracts implique généralement une collaboration entre toutes les parties prenantes au sein d’une organisation, y compris les Data Architects, les Data Engineers, les experts en conformité et les Business Analysts.

Data Architects

 

Les Data Architects jouent un rôle clé dans la définition des aspects techniques du Data Contract, tels que les structures de données, les formats et les règles de validation. Ils veillent à ce que le contrat soit aligné sur les principes et normes d’architecture de données de l’organisation, facilitant l’interopérabilité et l’intégration entre différents systèmes et applications.

Data Engineers

 

Les Data Engineers sont responsables de la mise en œuvre des spécifications techniques décrites dans le contrat. Ils développent des pipelines de données, des processus d’intégration et des routines de transformation pour garantir que les données sont échangées, traitées et stockées selon les exigences du contrat. Leur expertise en modélisation, en gestion de bases de données et en intégration est essentielle pour traduire le Data Contract en solutions opérationnelles.

Experts en conformité

 

Les experts en conformité jouent également un rôle crucial dans la création de Data Contracts en veillant à ce que les accords respectent les lois et réglementations. Ils examinent et rédigent des clauses contractuelles liées à la propriété des données, à la confidentialité, à la sécurité, aux droits de propriété intellectuelle et à la responsabilité, atténuant les risques juridiques et veillant à ce que les intérêts de toutes les parties impliquées soient protégés.

Business Analysts

 

Les Business Analysts contribuent en fournissant des informations sur les besoins métier, les cas d’utilisation et les dépendances de données qui guident la conception et la mise en œuvre du contrat. Ils aident à identifier les sources, à définir les attributs de données et à articuler les règles métier et les critères de validation qui orientent le développement du contrat.

L’importance des Data Contracts

 

Au cœur des Data Contracts réside l’établissement de lignes directrices, de termes et les attentes de la gestion des activités de partage de données. En définissant les droits, les responsabilités et les paramètres d’utilisation associés aux données partagées, les contrats aident à favoriser la transparence et à atténuer les conflits potentiels ou les malentendus entre les parties impliquées dans les échanges de données.

L’une des principales importances des Data Contracts est leur rôle dans la garantie de la qualité et de l’intégrité des données tout au long de leur cycle de vie. En définissant des normes, des formats et des protocoles de validation pour l’échange de données, les contrats favorisent le respect de structures de données cohérentes et de normes de qualité. Cela aide à réduire au minimum les divergences, les erreurs et les incohérences, améliorant ainsi la fiabilité et la confiance dans les actifs de données partagés pour les analyses et les processus de prise de décision.

Les Data Contracts servent d’outils indispensables pour promouvoir la gouvernance des données et la conformité réglementaire au sein des organisations. Dans un environnement de plus en plus réglementé, où les lois sur la protection des données et les normes de l’industrie régissent la manipulation et la protection des informations sensibles, les contrats fournissent un cadre pour la mise en œuvre de mesures robustes de protection et pour garantir le respect des exigences légales. En intégrant des dispositions relatives à la sécurité des données, à la confidentialité et à la conformité aux réglementations pertinentes, les contrats aident à atténuer les risques juridiques, à protéger les données sensibles et à maintenir la confiance et la confiance des parties prenantes.

Les Data Contracts facilitent la collaboration et le partenariat efficaces entre les différentes parties prenantes impliquées dans les initiatives de partage de données. En articulant les rôles, les responsabilités et les attentes de chaque partie, les contrats créent une compréhension partagée et un alignement des objectifs, favorisant un environnement de collaboration propice à l’innovation et à l’échange de connaissances.

En conclusion, les Data Contracts vont au-delà d’être de simples instruments juridiques ; ils servent de piliers pour promouvoir la prise de décision axée sur les données, favoriser la confiance et la responsabilité, et permettre aux écosystèmes d’échanger des données efficacement.

Qu’est-ce que la découverte des données sensibles ?

Qu’est-ce que la découverte des données sensibles ?

La protection des données sensibles s’est imposée comme une préoccupation majeure pour les entreprises data-driven. Mais, pour appliquer les stratégies de protection et d’exploitation adaptées, il faut encore inventorier avec précision les données sensibles. C’est la vocation de la découverte de données sensibles, ou sensitive data discovery en anglais. Pour tout comprendre, suivez le guide !

Si la confidentialité des données est une valeur cardinale, toutes les données ne se valent pas. Aussi faut-il distinguer les données sensibles qui doivent faire l’objet d’une attention, et d’une sécurisation particulières. Les données sensibles sont des informations personnelles ou confidentielles qui, si divulguées, pourraient causer des préjudices aux individus ou aux organisations.

Elles englobent une large gamme d’informations, notamment les données médicales, les numéros de sécurité sociale, les données financières, les données biométriques, les informations sur l’orientation sexuelle, les croyances religieuses, les opinions politiques, et bien d’autres.

Le traitement des données sensibles doit respecter des normes strictes en matière de sécurité et de protection de la vie privée. Au sein de votre entreprise, vous êtes donc tenu de mettre en place des mesures de sécurité robustes pour prévenir les fuites, les accès non autorisés et les violations de données. Cela inclut le chiffrement, l’authentification à deux facteurs, la gestion des accès, et d’autres pratiques de cybersécurité avancées.

Une fois ce principe admis, une question centrale persiste. Au sein de votre activité, collectez-vous et manipulez-vous des données sensibles ? Pour le savoir, vous devez vous engager sur le chemin de la découverte des données sensibles.

Comment définir et distinguer data discovery et sensitive data discovery ?

 

La découverte des données, également connue sous le nom de Data Discovery, est le processus par lequel vous pourrez identifier, collecter et analyser vos données pour en extraire des informations utiles. La découverte de données vise généralement à explorer et à comprendre les données dans leur ensemble, à identifier des tendances, à générer des rapports et à prendre des décisions éclairées. De fait, elle vous est absolument indispensable pour optimiser vos opérations commerciales, ou encore améliorer l’efficacité et optimiser la prise de décision basée sur des données.

Parallèlement, la découverte des données sensibles est une branche plus spécifique de la gestion de l’information. Elle se concentre sur l’identification, la protection et la gestion de données hautement confidentielles. La découverte des données sensibles consiste à localiser ces données au sein d’une organisation, à les classer, à définir des politiques de sécurité appropriées, et à garantir leur protection contre les violations de données et les accès non autorisés.

Que peut-on considérer comme données sensibles ?

 

Depuis l’entrée en vigueur du RGPD en 2018, la moindre donnée revêt un caractère de sensibilité. Cependant, les données sensibles répondent à une définition propre. Vous éprouvez quelques difficultés à y voir clair ? Voici quelques exemples.

Parmi ces données sensibles, on trouve d’abord les informations personnelles identifiables (également appelées PII). Il s’agit des noms, numéros de sécurité sociale, adresses ou encore numéros de téléphone, qui sont essentiels pour l’identification de vos clients ou de vos collaborateurs par exemple.

Les données bancaires, notamment les numéros de carte de crédit et les codes de sécurité sont, elles aussi, hautement sensibles car elles sont la cible de cyber délinquants. Les données clients, y compris les historiques d’achats, les préférences et les coordonnées, sont précieuses pour les entreprises, mais doivent être protégées pour protéger la vie privée de vos clients.
Les données de santé, telles que les dossiers médicaux, les diagnostics et les antécédents médicaux, sont particulièrement délicates en raison de leur nature personnelle et de leur importance pour les soins de santé.

La liste des données sensibles ne s’arrête pas là ! Ainsi, les documents légaux, tels que les contrats, les accords de non-divulgation et les correspondances juridiques, renfermant des informations juridiques cruciales, doivent rester confidentielles pour préserver les intérêts des parties impliquées. En fonction de votre activité, les données sensibles englobent un éventail de types d’informations critiques, exigeant des mesures de sécurité adéquates pour prévenir tout accès non autorisé ou violation.

Quelles sont les différentes méthodologies associées à la découverte de données sensibles ?

 

La découverte de données sensibles implique plusieurs méthodologies clés pour garantir non seulement leur bonne identification, mais aussi leur protection, leur gestion et leur conformité réglementaire.

Identification et classification

 

Cette méthodologie consiste à localiser les données sensibles au sein de l’organisation et à les classer en fonction de leur degré de confidentialité. Elle permet de cibler efficacement les données qui nécessitent une protection accrue.

Data Profiling

 

Le Data Profiling consiste à analyser les caractéristiques et les propriétés des données sensibles. Celui-ci permet de mieux comprendre ces données, d’identifier les incohérences éventuelles, les erreurs potentielles et les risques liés à leur exploitation.

Data Masking

 

Le Data Masking (également appelé anonymisation des données) est crucial pour protéger les données sensibles. Cette technique consiste à substituer ou à masquer des données de manière à ce qu’elles restent utilisables pour les besoins légitimes, tout en préservant leur confidentialité.

Conformité aux règlements

 

Le respect des lois et des réglementations liées à la protection des données sensibles est un axe stratégique. Des régimes tels que le RGPD en Europe ou HIPAA aux États-Unis imposent des normes strictes à suivre. Lorsqu’elles ne sont pas respectées, les conséquences peuvent être graves, tant sur le plan financier que sur celui de la réputation !

Conservation et suppression des données

 

La gestion fine de la conservation et de la suppression des données sensibles est essentielle pour éviter le stockage excessif de données. Veillez à garantir la destruction sécurisée des informations obsolètes, conformément aux réglementations.

Des usages spécifiques

 

En fonction des besoins particuliers de certaines activités, d’autres approches peuvent être mises en œuvre, telles que le chiffrement des données, l’audit des accès et des activités, la surveillance de la sécurité, ainsi que la sensibilisation des employés à la protection des données.

 

Les données sensibles sont une responsabilité majeure qui vous impose non seulement beaucoup de rigueur, mais aussi une remise en question continue de la gouvernance de données.

Comment l’IA peut-elle renforcer la gouvernance de vos données d’entreprise ?

Comment l’IA peut-elle renforcer la gouvernance de vos données d’entreprise ?

Si l’on se réfère à un rapport publié par le cabinet McKinsey à la fin de l’année 2022, 50% des organisations auraient déjà intégré l’usage de l’Intelligence artificielle tant pour optimiser les opérations de service que pour créer de nouveaux produits. Le développement de l’IA et du machine learning dans le quotidien des entreprises traduit le rôle éminent de la donnée dans les stratégies de développement des dirigeants. Pour fonctionner efficacement, l’IA dépend de vastes ensembles de données qui doivent faire l’objet d’une gouvernance méthodique et rigoureuse.

Derrière le concept de data governance, on trouve l’ensemble des processus, des politiques et des normes qui régissent la collecte, le stockage, la gestion, la qualité et l’accès aux données au sein d’une organisation. Le rôle de la gouvernance de données ? Garantir que les données sont précises, sécurisées, accessibles et conformes aux réglementations en vigueur. La relation entre l’IA et la gouvernance des données est étroite. En effet, les modèles d’IA apprennent à partir des données, et des données de mauvaise qualité ou biaisées peuvent entraîner des décisions erronées ou discriminatoires.

Vous souhaitez garantir que les données utilisées par les systèmes d’IA et leurs algorithmes sont fiables, éthiques et conformes au respect de la vie privée ? Alors l’enjeu de la gouvernance de données s’impose à vous comme un prérequis indispensable. En avançant de front sur un double projet d’IA et de data governance, vous créez une boucle vertueuse. En effet, l’IA peut elle-même être utilisée pour améliorer la gouvernance des données, en automatisant des tâches telles que la détection des anomalies ou la classification des données.

Retour sur les avantages (nombreux !) d’une gouvernance des données renforcée par l’IA.

Quels sont les avantages de l’IA pour une gouvernance data ?

Amélioration de la qualité de vos données

 

La qualité des données doit être le socle de toute stratégie data. Plus les données sont fiables, plus les enseignements, les choix et les orientations qui s’en dégagent gagnent en pertinence. Or, l’IA contribue à améliorer la qualité des données grâce à plusieurs mécanismes. Les algorithmes d’IA peuvent notamment automatiser la détection et la correction des erreurs dans les ensembles de données, réduisant d’autant les incohérences et les inexactitudes.

De plus, l’IA peut aider à normaliser les données en les structurant de manière cohérente, afin de fluidifier et fiabiliser leur exploitation, leur comparaison, leur mise en perspective. Avec l’apprentissage automatique (machine learning), il est également possible d’identifier des tendances et des modèles cachés dans les données, permettant ainsi de découvrir des erreurs ou des datas manquantes.

Automatisation de la mise en conformité de vos données

 

Alors que la cybermenace explose littéralement, l’enjeu de la conformité des données doit être une priorité dans votre entreprise. Mais garantir cette conformité suppose une vigilance de tous les instants qui ne peut être portée exclusivement par l’intelligence humaine. D’autant que l’IA peut surveiller de manière proactive les violations potentielles des réglementations en matière de données. Comment ? En effectuant une analyse en temps réel de l’ensemble des flux pour détecter toute anomalie ou tout accès non autorisé, et en déclenchant des alertes automatiques et effectuant même des préconisations pour corriger les problèmes éventuels. De plus, l’IA facilite la classification et l’étiquetage des données sensibles, garantissant leur traitement approprié. Enfin, les systèmes d’IA peuvent générer des rapports de conformité automatiques, réduisant la charge de travail administrative.

Renforcer la sécurité de vos datas

 

Par sa capacité à détecter les menaces de manière proactive en analysant en temps réel les modèles d’accès aux données, l’IA peut alerter sur des comportements suspects, tels que des tentatives d’intrusion ou d’accès non autorisé. Pour aller encore plus loin au service de la gouvernance des données, l’IA exploite des systèmes de détection des logiciels malveillants basés sur l’apprentissage automatique. Ces systèmes sont capables d’identifier des signatures de logiciels malveillants connus et détecter des variantes inconnues en analysant les comportements. Enfin, elle contribue à la sécurité en automatisant la gestion des correctifs de sécurité et en surveillant la conformité aux politiques de sécurité.

Démocratisation des données

 

Le cœur de votre stratégie data repose sur un objectif : encourager vos collaborateurs à utiliser les données à chaque fois que cela est possible. Ainsi, vous favorisez le développement d’une culture de la donnée au sein de votre organisation. La clé pour y parvenir consiste à faciliter l’accès à la data en simplifiant la recherche et l’analyse de données complexes. Les moteurs de recherche IA peuvent extraire rapidement des informations pertinentes à partir de vastes ensembles de données, permettant aux employés de trouver rapidement ce dont ils ont besoin. De plus, l’IA peut automatiser l’agrégation et la présentation de données sous forme de tableaux de bord interactifs, ce qui rend les informations toujours plus accessibles et faciles à partager !

Quel sera le futur de la gouvernance des données ?

 

Toujours plus de données, toujours plus d’analyses, toujours plus de prédictibilité. Tel est le sens de l’histoire. Ce faisant, les entreprises adopteront des approches plus holistiques de leurs enjeux. Prise de hauteur, prise de distance pour toujours plus de proximité avec leurs marchés. Pour relever le défi, il est capital d’intégrer la gouvernance des données dans les stratégies globales. Dans ce contexte, l’automatisation sera essentielle et reposera en grande partie sur des outils d’intelligence artificielle et de machine learning pour détecter, classer et sécuriser les données de manière proactive.

L’avenir s’écrira sous le prisme d’une plus grande collaboration entre les équipes IT, juridiques et métiers, essentielle pour garantir le succès de la gouvernance des données et maintenir la confiance de l’ensemble des parties prenantes.

Le Data Masking, le bouclier pour protéger votre entreprise

Le Data Masking, le bouclier pour protéger votre entreprise

Pour se protéger, le caméléon change de couleur. Le phasme quant à lui, imite l’apparence d’une brindille pour tromper les prédateurs… Le data masking ou masquage de données obéit au même principe ! Retour sur une approche méthodologique qui garantit à la fois la sécurité et l’exploitabilité de vos données.

Selon le rapport 2022 sur le coût d’une violation de données rédigé par les experts d’IBM, le coût moyen d’une violation de données est de 4,35 millions de dollars. Ce rapport révèle par ailleurs que 83% des entreprises étudiées ont subi plus d’une violation de données, et seulement 17 % ont déclaré qu’il s’agissait de leur première violation ! Parce que les données sensibles sont votre actif le plus précieux, elles sont convoitées et doivent être protégées efficacement. Les informations personnelles identifiables (PII) sont le type de données le plus coûteux parmi tous les types de données compromises. Pour les préserver (et préserver la confidentialité des informations), le Data Masking, s’est imposé comme une technique incontournable.

Qu’est-ce que le Data Masking ?

 

Le masquage des données, que l’on nomme également Data Masking, a été pensé pour assurer la protection de la confidentialité des informations sensibles. Sur le papier, le data masking consiste à remplacer des données réelles par des données fictives ou altérées, tout en préservant leur apparence et leur structure. Cette méthode est largement utilisée dans les environnements de test et de développement, ainsi que dans les scénarios de partage de données avec des tiers, afin de prévenir toute divulgation non autorisée. Le Data Masking garantit la sécurité des données tout en maintenant leur utilité et leur intégrité, ainsi qu’en minimisant les risques de violation de la confidentialité.

Quels sont les différents types de Data Masking ?

 

Pour assurer le masquage de vos données, le Data Masking peut s’appuyer sur plusieurs techniques qui présentent toutes un intérêt particulier et entre lesquelles vous pourrez choisir pour maximiser la protection de la data.

Static Data Masking

 

La méthode de masquage statique des données que l’on désigne par Static Data Masking consiste à altérer les données sensibles au sein d’une copie statique d’une base de données. Après une phase d’analyse, les données sont extraites de l’environnement de production et utilisées comme base pour la création de la copie statique. La phase de masquage repose sur la substitution des valeurs réelles par des valeurs fictives, la suppression partielle d’informations ou l’anonymisation des données. Avec cette méthode, les données sont modifiées de manière permanente et ne peuvent pas être restaurées à leur état d’origine.

Format Preserving Masking

 

Contrairement au masquage traditionnel, qui remplace les données par des valeurs fictives, le Format Preserving Masking (ou FPM) préserve la longueur, les types de caractères et la structure des données originales. Il exploite des algorithmes cryptographiques pour transformer les données sensibles en une forme irréversible et non identifiable. Les données ainsi masquées conservent leurs caractéristiques pour une utilisation ultérieure dans des systèmes et des processus nécessitant un format spécifique.

Dynamic Data Masking

 

Avec le Dynamic Data Masking (ou DDM), le masquage dynamique de vos données diffère à chaque fois qu’un nouvel utilisateur cherche à y accéder. Lorsqu’un de vos collaborateurs accède à une base de données, le DDM applique des règles de masquage définies pour limiter la visibilité des données sensibles, tandis que seuls les utilisateurs autorisés voient les données réelles. Le masquage peut être effectué en modifiant dynamiquement les résultats de requêtes, en remplaçant les données sensibles par des valeurs fictives ou en limitant l’accès à certaines colonnes.

On-the-fly Data Masking

 

Contrairement au masquage statique qui altère les données dans une copie, le On-the-Fly Data Masking, que l’on peut également appeler masquage en temps réel, se fait lors de l’accès aux données. Cette approche garantit une confidentialité renforcée sans nécessiter la création de copies supplémentaires des données. L’application du masquage en temps réel peut entraîner une surcharge de traitement, en particulier pour les grandes quantités de données ou les opérations complexes. Cela peut entraîner des retards ou des ralentissements dans l’accès aux données.

Quelles sont les différentes techniques de Data Masking ?

Substitution aléatoire

 

En appliquant la substitution aléatoire, les données sensibles telles que les noms, les adresses, ou encore les numéros de sécurité sociale, par exemple, sont remplacées par des données qui sont générées aléatoirement. Les noms réels peuvent ainsi être remplacés par des noms fictifs, les adresses par des adresses génériques, ou les numéros de téléphone par des numéros aléatoires.

Shuffling

 

Le shuffling (ou mélange) est une technique de masquage qui consiste à réorganiser l’ordre des données sensibles sans les altérer ou les modifier de manière significative. Lorsque le shuffling est appliqué, les valeurs sensibles d’une colonne ou d’un ensemble de colonnes sont mélangées de manière aléatoire. Ainsi, les relations entre les données d’origine sont préservées, tandis que leur association avec une entité spécifique devient quasiment impossible.

Encryption

 

Rendre les données sensibles illisibles à l’aide d’un algorithme de chiffrement, c’est la promesse de la technique de l’encryptage appliquée au masquage des données. Les données sont chiffrées à l’aide d’une clé spécifique, rendant ainsi les informations inintelligibles sans cette clé de déchiffrement correspondante.

Anonymization

 

Le principe de l’anonymisation repose sur la suppression ou la modification des informations qui pourraient permettre l’identification directe ou indirecte des individus. Cela peut inclure la suppression des noms, des prénoms ou encore des adresses.

Averaging

 

Avec le principe de l’averaging, une valeur sensible est remplacée par une valeur moyenne agrégée ou une approximation de celle-ci. Dans une base de données RH par exemple, au lieu de masquer un salaire individuel, l’averaging permet d’utiliser la moyenne des salaires de l’ensemble des salariés dans la même catégorie professionnelle. Cela fournit une approximation de la valeur réelle sans exposer les informations spécifiques d’un individu.

Date Switching

 

Lors de l’application du date switching, les valeurs de dates sont modifiées en conservant l’année, le mois et le jour, mais en les mélangeant ou en les remplaçant par d’autres dates qui n’ont pas de lien direct avec les données d’origine. Le date switching garantit que les informations temporelles sensibles ne peuvent pas être utilisées pour identifier ou retracer des événements spécifiques ou des individus, tout en maintenant une structure de date cohérente.

Conclusion

 

Le grand avantage du Data Masking pour les entreprises réside dans la préservation de la richesse informationnelle des données, de leur intégrité et de leur représentativité, tout en limitant au maximum le risque de compromission des données sensibles. Grâce au Data Masking, vous répondez à tous vos enjeux de conformité sans jamais renoncer à votre stratégie data.

Le Data Masking permet aux entreprises de créer des environnements de développement et de test sécurisés sans compromettre la confidentialité des données sensibles.

En masquant les données, les développeurs et les testeurs peuvent travailler avec des jeux de données réalistes tout en évitant l’exposition des informations confidentielles. Cela améliore l’efficacité des processus de développement et de test, tout en réduisant les risques liés à l’utilisation de données sensibles réelles.

5 Avantages du Data Lineage pour votre Entreprise

5 Avantages du Data Lineage pour votre Entreprise

Vous nourrissez l’ambition de faire de votre organisation une entreprise data-driven ? Vous n’échapperez pas à la nécessité de cartographier avec précision l’ensemble de vos actifs data, d’en monitorer la qualité et d’en garantir la fiabilité. Cette mission, le data lineage peut vous aider à l’accomplir. Explications.

Pour savoir quelles données vous utilisez, ce qu’elles signifient, connaître leur provenance, mesurer leur fiabilité tout au long de leur cycle de vie, vous devez disposer d’une vision holistique de tout ce qui est susceptible de les transformer, de les modifier et de les altérer. C’est exactement la mission que remplit le data lineage (lignage des données) qui est une technique d’analyse de données permettant de suivre le parcours des données depuis leur source jusqu’à leur utilisation finale. Une technique qui présente de nombreux avantages !

Avantage N°1 : Une gouvernance des données améliorée

 

La gouvernance des données est un enjeu prioritaire pour votre entreprise et pour délivrer tout le potentiel de votre stratégie data. En suivant le parcours de la donnée – de sa collecte jusqu’à son exploitation – le data lineage permet de comprendre d’où les données proviennent et les transformations qu’elles ont subies dans le temps pour créer un écosystème data riche et contextualisé. Ainsi, le data lineage facilite la recherche de la cause racine des problèmes liés aux données en permettant de remonter jusqu’à leur origine. Cette traçabilité constitue votre meilleur atout transparence au service de la gouvernance data.

Avantage N°2 : Des données plus fiables, précises et de qualité

 

Comme mentionné ci-dessus, une force incontournable du data lineage réside notamment dans sa capacité à tracer la provenance des données, mais aussi d’identifier les erreurs qui se produisent lors de leur transformation et de leur manipulation. Ainsi, vous êtes en mesure de non seulement corriger ces erreurs, mais également de faire en sorte qu’elles ne se reproduisent plus pour une meilleure qualité des données. Une logique d’amélioration continue particulièrement efficace dans le cadre d’une stratégie data. Par ailleurs, le data lineage permet de suivre les changements apportés aux données, de savoir qui les a modifiées et quand. Cela améliore la transparence et permet aux utilisateurs de comprendre comment les données ont été obtenues et traitées.

Avantage N°3 : Une analyse d’impact rapide

 

Faire en sorte que vous ne persistiez jamais trop longtemps dans l’erreur. C’est l’une des promesses tenues par le data lineage. Comment ? En identifiant les flux de données avec précision. Cette première phase repose sur une connaissance fine de vos processus métier et des sources de données disponibles. Lorsque les flux de données critiques sont identifiés et cartographiés, il est possible d’analyser rapidement les impacts potentiels d’un changement sur les données et les processus métier. Les impacts de chaque transformation de la data étant évalués en temps réel, vous disposez de tous les éléments indispensables pour identifier les voies et moyens qui permettent d’en circonscrire les conséquences. Visibilité, traçabilité, réactivité, le data lineage saura vous faire gagner un temps précieux !

Avantage N°4 : Plus de contexte pour les données

 

Vous l’avez compris, le data lineage veille en continu sur le parcours de vos actifs data. Dès lors, au-delà de la source d’origine de la donnée, vous disposez d’une visibilité totale sur les transformations qui ont été appliquées aux données tout au long de leur parcours. Une visibilité qui s’étend également à l’utilisation qui est faire de la data au sein de vos différents processus de traitement ou par le biais des applications déployées dans votre organisation. Ce suivi ultra précis de l’historique des interactions avec la data, permet de donner davantage de contexte aux données en vue d’en améliorer la qualité, de faciliter les analyses et les audits et de prendre des décisions plus éclairées en se basant sur des informations précises et complètes.

Avantage N° 5 : Construire des rapports de conformité (plus !) fiables

 

Les principales attentes du régulateur en matière de conformité sont la transparence et la traçabilité. Il s’agit du cœur de la promesse de valeur du Data lineage. En exploitant le data lineage, vous avez toutes les cartes en mains pour réduire les risques de non-conformité, améliorer la qualité des données, faciliter les audits et les vérifications, et renforcer la confiance des parties prenantes dans les rapports de conformité produits.

4 bonnes pratiques data pour une stratégie ESG efficace

4 bonnes pratiques data pour une stratégie ESG efficace

La gouvernance environnementale et sociale d’entreprise (ESG) est un sujet central pour les CDO, les CFO et les gestionnaires de données. Dans cet article, découvrez les bonnes pratiques à déployer dans votre entreprise pour livrer un reporting efficace de vos données ESG.

Incendies gigantesques, inondations, canicules, l’année 2022 a sonné comme un tournant dans les changements climatiques qui se manifestent dans le monde entier. Un tournant qui marque les consciences et amène les entreprises (et la société dans son ensemble) à agir de manière plus responsable et plus durable. Plus qu’une simple tendance, le déploiement d’une stratégie ESG pertinente est un enjeu majeur pour les entreprises.

Cet acronyme désigne les critères Environnementaux, Sociaux et de bonne Gouvernance utilisés pour analyser et évaluer la prise en compte du développement durable et des enjeux de long terme dans la stratégie des entreprises. Il affecte directement la façon dont vous assurez la gestion, l’administration et l’exploitation de vos actifs data. Longtemps cantonnée à une dimension incantatoire ou à de la simple communication, la gouvernance ESG repose désormais sur des éléments de preuve. Des preuves qui se nourrissent de données ESG.

Investisseurs, partenaires, clients, l’opinion au sens large du terme, exigent désormais une réelle transparence – non seulement sur la manière dont les organisations protègent et utilisent efficacement les données pour créer de la valeur – mais aussi sur la manière dont elles atteignent la durabilité en mettant l’accent sur la responsabilité sociale des entreprises et l’impact environnemental appliquée à la gestion des données.

Quel est le rôle des données ESG pour les entreprises ?

Parce que les entreprises doivent démontrer leurs engagements en faveur du développement durable par les faits, les données ESG jouent un rôle déterminant. Ces données sont analysées par des agences de notation extra-financières indépendantes qui s’assurent de la véracité des allégations des entreprises. Les informations déclarées font l’objet de recoupements avec d’autres sources d’informations émanant d’organisations non gouvernementales, d’associations ou d’institutions. Ces données donnent ensuite lieu à une évaluation précise des pratiques ESG d’une entreprise au sein d’un secteur d’activité.

Quelles sont les bonnes pratiques pour réussir son reporting data ESG ?

La préparation d’un reporting data ESG efficace et pertinent repose sur une méthodologie précise et exigeante. L’enjeu : collecter rapidement les informations nécessaires au reporting ESG, en assurer une traçabilité optimale et une sécurisation rigoureuse.

Pour relever le défi, il faut être en mesure d’appliquer un certain nombre de bonnes pratiques.

Centraliser toutes les données dans un seul endroit

Le socle de la transparence inhérente à l’ambition d’un reporting data ESG sincère et pertinent est la capacité à centraliser l’ensemble des données dans un unique espace de collecte et de traitement. Cette centralisation est un prérequis indispensable à une gouvernance des données représentative de l’esprit qui anime votre entreprise.

Garantir la traçabilité des données (data lineage)

Parce que le cœur d’une reporting data ESG sincère est la traçabilité des données, vous devez impérativement vous doter d’un outil de Data Lineage. Ce dernier assure un suivi en temps réel de la data et agit comme une aide au sein de votre entreprise pour vous assurer que vos données émanent d’une source fiable et maîtrisée ; que les transformations qu’elles ont pu subir soient connues, suivies et légitimes ; et qu’elles soient disponibles au bon endroit, au bon moment et pour le bon utilisateur.

Mettre en place une politique de gouvernance des données

Qualité, fiabilité, traçabilité. Tels sont les trois piliers qui garantissent la véracité de vos données ESG et témoignent de votre engagement sincère pour le développement durable. Ces trois piliers sont réunis autour d’un enjeu clé : une réelle politique de gouvernance des données. La gouvernance des données consiste en la gestion globale de la disponibilité, de l’exploitabilité, de l’intégrité et de la sécurité des données utilisées dans votre entreprise.

Démocratiser l’accès aux données pour tous (data literacy)

L’un des enjeux majeurs pour garantir la fiabilité, la sécurité et la transparence des données ESG est de s’assurer que l’ensemble des parties prenantes au sein de l’entreprise s’appuie sur une culture forte de la donnée. Cette culture Data permet à chaque collaborateur de se positionner comme un maillon essentiel de la qualité des données en revendiquant une capacité à identifier, traiter, analyser et interpréter des datas. Connue également sous le nom de Data Literacy, cette culture des données permet de développer un esprit critique qui donne toute leur valeur aux actifs informationnels de l’entreprise.

Qu’est-ce que le BCBS 239 ?

Qu’est-ce que le BCBS 239 ?

Pour disposer d’une visibilité complète sur l’exposition au risque des établissements bancaires majeurs, le Comité de Bâle a défini 14 principes clés réunis dans une norme appelée BCBS 239. Au cœur des enjeux : l’accès à des données fiables et consolidées. Explications.

En 2007, l’économie mondiale vacillait sur ses bases. Un certain nombre d’institutions bancaires supposées stables ont flirté avec la faillite suite à la défaillance de la banque américaine Lehman Brothers.

En réaction à une crise d’une violence inédite, un vent de régulation a soufflé sur le monde, donnant naissance à BCBS 239 connu également sous le nom de Basel Committee on Banking Supervision standard numéro 239. 

Derrière cette appellation, on trouve la norme n°239 du Comité de Bâle, publiée en 2013. Intitulée « Principes aux fins de l’agrégation des données sur les risques et de la notification des risques », BCBS 239 a vocation à créer les conditions de la transparence dans des établissements bancaires en définissant un cadre précis en matière d’agrégation des données de risques financiers.

En pratique, il s’agit de permettre aux institutions financières et établissements bancaires de produire des reportings précis des risques auxquels ils sont exposés. BCBS 239 constitue un cadre contraignant mais contribue à la stabilité du système financier mondial, durement éprouvé lors de la crise financière de 2007.

 

BCBS 239 : un peu d’histoire

A l’origine de BCBS 239, il y a le Comité de Bâle qui a vu le jour en 1974 à l’instigation des gouverneurs des banques centrales du G10. Depuis 2009, l’organisation compte 27 pays membres et s’est donnée pour mission de renforcer la sécurité et la fiabilité du système financier et d’établir des standards en matière de contrôle prudentiel. 

BCBS 239 est l’une des normes les plus emblématiques du Comité de Bâle car elle constitue un barrage aux dérives qui ont mené à la crise de 2007. 

En effet, la croissance et la diversification des activités des institutions bancaires ainsi que la multiplication des filiales au sein d’un même groupe, créaient un certaine opacité qui générait des imprécisions dans les reportings des banques. 

Des imprécisions qui pouvaient, une fois accumulées, représenter des milliards d’euros de flou, entravant les prises de décision rapides et sûres des dirigeants. La taille critique atteinte par les établissements financiers exigeait de garantir des prises de décision fiables et fondées sur des données consolidées et de qualité. C’est la vocation même de BCBS 239.

 

Les 14 principes fondateurs de BCBS 239

Si la norme BCBS 239 a été publiée en 2013, la trentaine d’établissements bancaires de type G-SIBs (établissements d’importance systémique au niveau mondial) devant s’y conformer avaient jusqu’au 1 janvier 2016 pour le faire. Les établissements bancaires d’importance systémique au niveau national quant à eux (également appelés D-SIBs) ont eu trois ans de plus pour se mettre en conformité.

Depuis le 1er janvier 2019, G-SIBs et D-SIBs doivent donc répondre aux 14 principes édictés par BCBS 239. Onze d’entre eux concernent les établissements bancaires au premier chef. Les trois autres s’adressent aux autorités de contrôle. 

Les 14 principes de BCBS 239 peuvent être classés selon quatre catégories : gouvernance et infrastructure, capacités d’agrégations de données sur les risques, capacités de reporting, surveillance prudentielle. 

 

Gouvernance et infrastructure

En matière de gouvernance et d’infrastructure, on dénombre deux principes.

Le premier porte sur le déploiement d’un dispositif de gouvernance de la qualité des données en vue d’améliorer la communication financière et la production de reporting à la fois plus précis et plus pertinents afin d’accélérer et fiabiliser les processus de décision. 

 

Capacités d’agrégations de données sur les risques

Le second principe affecte l’infrastructure informatique et fait obligation aux banques de mettre en place une architecture de données permettant l’automatisation et la fiabilisation de la chaîne d’agrégation de données.

La partie concernant les capacités d’intégration des données sur les risques rassemble quant à elle quatre principes clé : l’exactitude et l’intégrité des données, l’exhaustivité, le respect des délais et l’adaptabilité.

Quatre piliers permettant de fonder les prises de décisions sur des éléments tangibles, fiables et actualisés. 

 

Capacités de reporting

Le troisième volet de BCBS 239, concerne l’amélioration des pratiques de notification des risques.

C’est un volet important de la norme qui rassemble cinq principes : l’exactitude et la précision des informations, l’exhaustivité des informations liées aux risques encourus afin de garantir une visibilité réelle et sincère sur l’exposition de l’établissement aux risques, mais aussi la clarté et l’utilité des reportings, la fréquence d’actualisation et la sincérité de la distribution.

Ces reportings devant être transmis aux personnes concernés. 

 

Supervision

Les trois derniers principes s’appliquent aux autorités de contrôle et de supervision.

Ils fixent les conditions de la surveillance sur la conformité des banques aux 11 premiers principes. Ils prévoient par ailleurs la mise en place d’actions correctives et de mesures prudentielles et fixent le cadre d’une coopération avec les autorités de contrôles.

 

Grâce à BCBS 239, la donnée devient l’un des leviers de la stabilité d’une économie mondialisée !

La cartographie des données, clé pour rester conforme aux réglementations

La cartographie des données, clé pour rester conforme aux réglementations

Quel que soit le secteur d’activité, la maîtrise des données est un axe stratégique clé pour les entreprises. Ces informations sont clés pour innover sur les produits et services de demain. De plus, avec l’essor de nouvelles technologies comme le Big Data, l’IoT ou encore l’intelligence artificielle, les organisations récoltent des volumes exponentiels de données, provenant de sources différentes avec des formats variés.

De plus, avec les réglementations data de plus en plus strictes comme le RGPD, le traitement des données nécessite désormais la mise en place de mesures de sécurité adaptées afin de protéger les fuites d’informations et des traitements abusifs. 

Tout l’enjeu se trouve ainsi dans la réappropriation de son patrimoine de données. Autrement dit, les entreprises cherchent des solutions pour maintenir une cartographie des données reflétant leur réalité opérationnelle

 

Qu’est ce qu’une cartographie des données ?

Retournons aux bases : une cartographie des données est un “mapping” qui permet d’évaluer et visualiser de manière graphique les points d’entrée des données ainsi que leurs traitements. Il y a plusieurs types d’informations à cartographier, tels que:

  • Les informations sur les données
  • Les traitements des données

Sur les données

L’idée d’une cartographie sur les données est de travailler sur la sémantique data (étude des sens et de leurs significations

Ce travail ne se fait pas sur les données elles-mêmes, mais plutôt à travers les métadonnées. Elles permettent d’appréhender au mieux le sens de la donnée et son contexte. Ces métadonnées peuvent représenter le nom “métier” de la donnée, son nom technique, la localisation de la donnée, quand elle à été stockée, par qui, etc. 

En mettant en place des règles sémantiques et un langage data commun à travers un business glossary, les entreprises peuvent identifier et localiser leurs données, et donc, faciliter l’accès aux données pour l’ensemble des collaborateurs.

 

Sur les traitements data

Concernant les traitements des données, il est important de recenser :

  • les flux de données: avec leurs sources et leurs destinations,
  • les transformations des données : toutes les transformations appliquées à la donnée au cours du traitement.

Un outil puissant : Le Data Lineage

Le Data Lineage se définit comme étant le cycle de vie d’une donnée et un suivi de toutes les transformations qui ont eu lieu entre son état initial et son état final. 

Le data lineage est fortement lié à la cartographie d’un traitement des données ; on doit voir quelles données sont concernées par ce traitement et pouvoir analyser les impacts très rapidement. Par exemple, si une anomalie du traitement a provoqué une corruption des données, on peut savoir quelles données sont potentiellement concernées.

Dans un autre cas de figure, la cartographie du point de vue d’une donnée doit pouvoir dire sur quels jeux de données la donnée est issue.  Ainsi, on peut analyser rapidement les impacts d’une modification de jeu de données source en retrouvant rapidement les données liées. 

 

Les bénéfices de la mise en place de cartographie des données

Avec une solution de cartographie, les entreprises peuvent donc répondre aux réglementations data, notamment le RGPD, en répondant à ces questions :

Qui ? Qui est responsable d’une donnée ou d’un traitement ? À la protection des données ? Qui sont les éventuels sous-traitants ?

Quoi ? Quelle est la nature des données collectées ? Est-ce des données sensibles ?

Pourquoi ? Pouvons-nous justifier de la finalité de la collecte et du traitement des informations?

Où ? Où sont hébergées les données ? Dans quelle base ? 

Jusqu’à quand ? Quelle est la durée de conservation de chaque catégorie de données ?

Comment ? Quel est le cadre et quelles sont les mesures de sécurité mises en place pour une collecte et un stockage sécurisé des données personnelles?

En répondant à ces questions, les Responsable SI, Responsable Data Lab, Business Analyst ou encore Data Scientist se posent pour rendre un travail sur la donnée pertinent et efficace.

Ces questions mises en exergue permettent aux entreprises à être conforme aux réglementation mais également de :

  • Améliorer la qualité des données et renseigner un maximum d’informations qui permet aux utilisateurs de savoir si les données sont aptes à être utilisées.
  • Rendre les collaborateurs plus efficaces et autonomes dans la compréhension des données grâce à une cartographie des données graphique et ergonomique.
  • Analyser de manière profonde les données, afin de pouvoir prendre de meilleures décisions basées sur les données et finalement, devenir une organisation data-driven.

 

Conclusion

C’est en ayant un patrimoine de données correctement cartographié qu’une entreprise va pouvoir tirer parti de ses données. Une analyse des données de qualité n’est possible qu’avec des data correctement documentées, tracées, et accessibles à tous. 

Vous êtes en recherche d’outil de cartographie des données?

Vous pouvez avoir plus d’informations sur notre solution de catalogue de données en visitant les liens ci-dessous :

Zeenea Data Catalog

Zeenea Studio – la solution pour les data managers

Zeenea Explorer – faciliter le quotidien de vos équipes data

ou prendre rendez-vous directement avec nous pour une démo de notre solution :

Le bilan des DPO sur le RGPD

Le bilan des DPO sur le RGPD

Depuis mai 2018, le règlement général sur la protection des données (RGPD) oblige les entreprises à assigner un “DPO”, ou Data Protection Officer au sein de leur organisation. Ce nouveau métier consiste à gérer les données personnelles et à informer les autres employés des obligations à respecter au regard de la réglementation européenne.

Plus d’un an après la mise en place de cette réglementation, nous avons animé un atelier avec des DPO de différents secteurs d’activités avec une seule idée en tête : Comment les aider dans la mise en application du RGPD ? Nous vous partageons aujourd’hui leurs retours.

État des lieux

Pour mieux comprendre les Data Protection Officers et leur fonction, faisons déjà un constat de leur situation actuelle.

Les outils

Notre audience confirme que les applications ne sont qu’un moyen à la mise en place d’une gouvernance sur les données.

Les entreprises ont malgré tout adopté de nouveaux outils pour les aider à la mise en place du RGPD. Ces logiciels sont souvent jugés peu intuitifs et difficiles à utiliser. Toutefois, certains arrivent à se démarquer :

Parmi les outils du DPO, nous avons listé les très appréciés catalogues d’applications, principalement pour la vision macro offerte des échanges entre applications et la détection facile et rapide des informations personnelles en leur sein.

En parallèle, les data catalogs, derniers arrivés sur le marché, font mouche auprès de la communauté des DPO. Investir dans ces outils est un choix stratégique que certains participants ont déjà entrepris. La possibilité d’informer et historiser l’information sur les données, en allant recenser les données collectées par l’entreprise, les a en effet conquis !

La gouvernance

Les DPO ont bien conscience que l’effort doit être placé sur l’acculturation et une sensibilisation des collaborateurs pour espérer de meilleurs résultats.

La recherche d’une gouvernance n’a pour but que d’aider les métiers à appréhender et évaluer les risques sur les données qu’ils manipulent. Leur énergie est ainsi placée sur la mise en place d’un pilotage efficace et une communication de règles partagées afin que l’entreprise acquiert les bons réflexes. Car oui, la donnée reste un sujet que peu de collaborateurs maîtrisent en entreprise.

Les systèmes d’information

L’hétérogénéité des systèmes d’information est un environnement “normal” auquel les DPO sont confrontés.

Ils sont ainsi confrontés à essayer par tous les moyens de mettre en conformité des SI qui s’avèrent bien souvent complexes et coûteux à mettre à jour techniquement.

À l’international

Nous associons aux DPO le fameux Règlement Des Données RGPD, en oubliant bien souvent “le reste du monde”.

De nombreux pays ont également leur propre règlements comme la Suisse et les Etats Unis. Les DPO n’y échappent pas et l’entreprise non plus !

Une chose est sûre, l’ampleur du travail est gigantesque et demande une forte priorisation des sujets. Mais au-delà des priorisations liées à l’urgence, cela demande de trouver le bon curseur entre répondre aux normes de conformités et répondre aux exigences business !

Les challenges des DPOs pour 2020

Face à ce précédent constat, l’atelier s’est conclu sur 2020 et ses nouveaux challenges.

Nous avons réalisé avec eux la liste des “résolutions” pour la nouvelle année :

  • Investir plus sur l’amélioration de la qualification et l’exigence de la documentation des données,
  • Intégrer plus d’exemples dans la phase de sensibilisation des collaborateurs sur les bonnes pratiques,
  • Apporter des indicateurs précis sur l’usage et la finalité de la donnée afin de prévoir au plus tôt les risques et impacts de celle-ci,
  • Devenir une partie prenante dans la mise en place d’une gouvernance des données afin de garantir une acculturation efficace sur la donnée en entreprise.

RGPD : Quelles sont les tendances en 2019 ?

RGPD : Quelles sont les tendances en 2019 ?

Le marché du Big Data a beaucoup évolué depuis l’entrée du Règlement Général sur la Protection des Données (RGPD) le 25 mai 2018 : de nouveaux partenariats se sont formés, de nouvelles technologies sont nées et des startups ont décollé.

Néanmoins ce n’est qu’un début ! Cette année 2019, les entreprises continueront à adapter la gestion de leurs données. Cet article vous présentera les prédictions et tendances du RGPD en 2019.

 

Le bilan du RGPD en 2018

Le règlement a certainement été le sujet de l’année ! Le RGPD a profondément changé la manière dont les entreprises traitent les données pour aussi bien les entreprises du CAC 40 que pour les TPE/PME. Globalement, nous constatons que les entreprises ont commencé l’adaptation au RGPD à travers plusieurs changements :

 

La notification des violations de données

Il est maintenant obligatoire de déclarer à la CNIL dans les 72h, toute violation des données personnelles susceptibles à causer des risques pour les individus. Dès réception, la CNIL va enquêter la notification et pourra clôturer votre dossier ou vous imposer d’informer les personnes concernées selon quelques critères.
Rendez vous sur : https://www.cnil.fr/fr/notifier-une-violation-de-donnees-personnelles pour plus d’informations.

 

La mise en place d’une gouvernance sur la protection des données

Très peu d’entreprises avaient une véritable gouvernance autour de la protection des données avant le RGPD ; elles étaient confiées au département juridique ou au CIL (Correspondant Informatique et Libertés). Mais depuis le règlement, selon le dernier rapport annuel IAPP-EY, un peu prêt 50% des entreprises ont mis en place une organisation dédiée sur la protection de données. Selon la CNIL, elle compte plus de 15 000 Data Protection Officers (DPO) contre 5 000 CIL avant le RGPD.

 

La mise à jour des politiques de confidentialités

La plupart des entreprises ont également dû procéder à une révision de leurs politiques de confidentialités et mentions légales.

Toutefois, elles ont dû aussi mettre à jour à des contrats fournisseurs ou partenariats avec de nouvelles clauses “protection de données”. L’inondation de nos boîtes mails autour du 25 mai ont certainement prouvé l’importance du RGPD !

 

La sensibilisation du règlement au sein de l’entreprise

Enfin, vous avez peut être remarqué au sein de votre entreprise, la sensibilisation de la protection des données entre collaborateurs était importante, que ça soit des modules e-learning, des formations ou bien diverses communications internes.

 

Les prédictions et tendances du RGPD en 2019

Afin de se protéger d’une très grosse amende (jusqu’à 4% du chiffre d’affaires ou 20 millions d’euros), les entreprises vont devoir continuer à s’adapter au RGPD. Les autorités de données, comme la CNIL, se sont montrées très indulgentes en 2018 et donc elles pourraient devenir plus strictes en 2019. Les entreprises doivent donc impérativement s’acclimater au règlement, aussi bien en Europe qu’aux États Unis.

Le RGPD est lui même une tendance en 2019; il sera bientôt considéré comme étant une norme globale. Dans l’Oregon par exemple, le sénateur Ron Wyden a récemment introduit le “Consumer Data Privacy Act”. Il y a également le Japon, la Corée et la Tunisie qui adoptent des règlements similaires au RGPD. Mick Levy, Directeur de l’Innovation Business chez Business & Decision dit :

“La data est un actif de l’entreprise, comme son capital humain ou ses moyens de production. Il faut se donner les moyens de l’exploiter et de le protéger.” (orange-business.com)

 

Comment mettre en place une bonne gouvernance des données tout en s’adaptant au RGPD ?

Comme cité ci-dessus, une bonne gouvernance de données est obligatoire aujourd’hui afin de bien les organiser, rechercher, extraire et protéger. Zeenea vous propose un data catalog qui est capable de centraliser la connaissance data de votre entreprise dans une plateforme intuitive pour vous aider à devenir une entreprise data-driven et construire une gouvernance de données en mode lean startup agile.

GPDR : Qu’est-ce qu’un registre de traitements de données personnelles ?

GPDR : Qu’est-ce qu’un registre de traitements de données personnelles ?

Avec l’arrivée de la GDPR dans quelques mois, les entreprises devront répondre à cette « simple » question : Que faisons-nous des données personnelles de nos clients et prospects ?

L’article 30 de la GDPR impose la tenue d’un registre des traitements qui devra contenir un certain nombre d’informations sur les traitements effectués sur les données personnelles.  Ainsi, une entreprise doit être capable de cartographier ces traitements en cas de contrôle de la CNIL. Cette documentation a pour objectif de démontrer la bonne mise en conformité des entreprises avec la règlementation.

 

Les 6 questions d’un registre de traitements

De façon simplifiée, le registre de traitements de la GDPR doit répondre à 6 questions :

  • Qui ? le nom et les coordonnées du responsable de traitement et, le cas échéant, du responsable conjoint du traitement, du sous-traitant, du représentant du responsable de traitement et du délégué à la protection des données ;

  • Pourquoi ? la finalité du traitement des données. Une formulation générale et un descriptif plus complet ;

  • Quoi ? la description des catégories de personnes concernées et des données traitées pour chacune des finalités identifiées;

  • Où ? Le but est de localiser les données, de préciser les destinataires, les transferts de données vers des pays tiers à l’Union et l’EEE ainsi que la documentation corrélée : ce qui implique une gestion dynamique du registre ;

  • Jusqu’à quand ? les informations concernant la durée de conservation des données ;

  • Comment ? Il s’agit d’une description générale des mesures de sécurité techniques et organisationnelles mises en place.

Une opportunité du Big Data

Ce registre de traitement peut être vue comme une opportunité pour le Big Data ! En répondant aux questions ci-dessus, les entreprises pourront créer une traçabilité sur leurs données au sein des environnements Big Data et obtenir ce que l’on nomme un data lineage. Cet outil permettra de s’assurer que les entreprises respectent bien les principes de finalité et de minimisation de la GDPR.

De plus,  être bien organisé et maintenir une traçabilité de ses données est une excellente chose pour la productivité en générale, notamment les data scientists. Ils pourront plus facilement accéder :

 

  • Connaître la documentation sur l’origine et la création des données éventuellement utilisables dans un algorithme prédictif.
  • Se renseigner sur la provenance des données.
  • Maintenir des algorithms prédictifs.
  • Industrialiser des traitements et mettre en production des algorithms.

GDPR – 8 nouveaux droits à garantir aux résidents européens

GDPR – 8 nouveaux droits à garantir aux résidents européens

En décembre dernier, Matthieu Blanc – VP Product de Zeenea – s’est posé la question : Ce que la GDPR va changer dans le monde Big Data ? Dans cette série d’articles, nous revenons sur les aspects légaux explicités durant sa conférence lors de la XebiCon’17.

 

Un des principaux objectifs de la GDPR est de renforcer les droits des personnes physiques.

Les résidents européens se voient attribuer 8 nouveaux droits :

 

1) Droit à l’information (Art. 13 et 14)

Lorsque les données sont collectées auprès  d’une personne physique, plusieurs informations doivent lui être communiquées. Il s’agit notamment des finalités du traitement ou encore des droits dont elle dispose. Il est important que la politique de confidentialité et celle relative à la protection des données soient facilement accessibles et mises à jour.

Un lien vers la politique de confidentialité doit être fourni à chaque fois que des données sont recueillies, à partir de formulaires d’inscription en ligne par exemple.

 

2) Droit d’accès (Art. 15)

Exercer son droit d’accès permet de contrôler l’exactitude de ses données et, au besoin, de les faire rectifier ou effacer. Pour exemple, vous pourrez demander au responsable d’un fichier s’il détient des informations sur vous, et à ce que l’on vous communique l’intégralité de ces données.

 

3) Droit de rectification (Art. 16)

Le droit de rectification complète le droit d’accès. Une personne peut demander que ses données inexactes soient rectifiées, ou incomplètes d’être complétées. Il permet d’éviter qu’un organisme ne traite ou ne diffuse de fausses informations sur vous.

 

4) Droit à la portabilité (Art. 20)

Il s’agit d’un nouveau droit. Le droit à la portabilité offre aux personnes la possibilité de récupérer une partie de leurs données dans un format ouvert et lisible par machine. Elles peuvent ainsi les stocker ou les transmettre facilement d’un système d’information à un autre, en vue de leur réutilisation à des fins personnelles. Cela peut être le cas avec les opérateurs télécoms par exemple.

 

5) Droit d’opposition (Art. 21)

Toute personne a la possibilité de s’opposer, pour des motifs légitimes, à figurer dans un fichier. Elle peut également refuser, sans avoir à se justifier, que ses données soient utilisées à des fins de prospection commerciale.

 

6) Droit à l’effacement ou droit à l’oublie (Art. 17)

Une personne a le droit d’obtenir, dans les meilleurs délais, l’effacement de ses données, lorsque : 

  • la personne a retiré son consentement au traitement,

  • la personne s’oppose au traitement,

  • les données ne sont plus nécessaires au regard des finalités du traitement,

  • ses données ont fait l’objet d’un traitement illicite,

  • ses données doivent être effacées en vertu d’une obligation légale, sauf dans certains cas.

Si le responsable du traitement a rendu publiques les données, il devra informer les autres responsables du traitement qui les traitent qu’il faille effacer ces données ainsi que toutes reproductions de celles-ci.

 

7) Droit à la limitation du traitement (Art. 18)

Une personne a le droit d’obtenir la limitation du traitement lorsqu’elle s’y est opposée, lorsqu’elle conteste l’exactitude des données, lorsque leur traitement est illicite, ou lorsqu’elle en a besoin pour la constatation, l’exercice ou la défense de ses droits en justice.

 

8) Prise de décision automatisée (Art. 22)

La personne concernée a le droit de ne pas faire l’objet d’une décision fondée exclusivement sur un traitement automatisé, y compris le profilage, produisant des effets juridiques la concernant ou l’affectant, sauf lorsque cette décision est nécessaire à la conclusion ou à l’exécution d’un contrat, est autorisée légalement, ou est fondée sur son consentement.

 

Visionnez la conférence GDPR & Big Data

À quelques mois de l’entrée en vigueur de la GDPR, les entreprises essaient encore de comprendre les mesures organisationnelles et techniques à mettre en place autour de leurs Big Data. Venez trouver les réponses à vos questions et balayons ensemble les actions à mener pour une mise en conformité du règlement.

GDPR – 7 principes à respecter pour traiter des données personnelles

GDPR – 7 principes à respecter pour traiter des données personnelles

En décembre dernier, Matthieu Blanc – VP Product de Zeenea – s’est posé la question : Ce que la GDPR va changer dans le monde Big Data ? Dans cette série d’articles, nous revenons sur les aspects légaux explicités durant sa conférence lors de la XebiCon’17.

 

Les traitements sur les données personnelles devront obéir à 7 principes : 

 

1) Le principe de licéité, loyauté et transparence

La loi impose que les données soient collectées et traitées de manière loyale et licite, dictant donc de manière implicite au responsable du traitement une transparence lors du traitement auprès de la personne concernée.

Pour rentrer un peu plus dans le détail :

  • La loi garantit aux personnes ayant soumis leurs données, l’information nécessaire relative aux traitements les concernant.

  • Elle les assure de la possibilité d’un contrôle personnel.

  • Le responsable du traitement de données personnelles a l’obligation d’avertir ces personnes dès la collecte des données et en cas de transmission de ces données à des tiers.

2) Le principe de finalité

Les données à caractère personnel doivent être recueillies et traitées que pour un usage déterminé et légitime, correspondant aux missions de l’établissement ou du responsable du traitement. Tout détournement de finalité est passible de sanctions pénales.

 

3) Le principe de proportionnalité

Le règlement exige que les données ne soient collectées que pour un traitement bien spécifique et clairement défini.
Pour exemple : dans le cas d’une opération de marketing direct soumise à ce principe où le nom, prénom et l’adresse email suffisent amplement au traitement envisagé, la collecte pour cette même finalité de l’adresse postale, la situation familiale, financière, etc., sera jugée non proportionnelle et donc coupable d’une sanction.

 

4) Le principe de pertinence des données

Autrement dit, les entreprises doivent faire en sorte que les données soient exactes et mises à jour si nécessaire.

 

5) Le principe de durée limitée de conservation des données

Les informations ne peuvent être conservées de façon indéfinie dans les fichiers informatiques. Une durée de conservation doit être établie en fonction de la finalité de chaque fichier. Passée cette limite, les données doivent être supprimées ou rendues anonymes.

 

6) Le principe de sécurité et de confidentialité

Le règlement prévoit un renforcement des mesures de sécurité. Les entreprises sont responsables de la sécurité des données qu’elles traitent et doivent mettre en place les mesures adéquates pour la garantir (pseudonymisation des données, analyses d’impact, tests d’intrusion, etc.).

Ainsi, le responsable du traitement est astreint à une obligation de sécurité. Il doit faire prendre les mesures nécessaires pour :

  • Garantir la confidentialité des données et éviter leur divulgation. En d’autres termes, le responsable de traitement doit s’assurer que des tiers non autorisés ne peuvent accéder aux données.

  • Empêcher que les données soient déformées ou endommagées.

  • Etc.

Cette responsabilité est  mise en avant par un nouveau principe de « Privacy By Design ». Ce principe désigne  la démarche visant à prendre toutes les mesures permettant de protéger les droits des personnes en amont (c’est à dire dès la conception d’un produit ou d’un service) et tout au long du cycle de vie des données (de leur collecte à leur suppression).

Des mesures de sécurité, tant physique que logique, doivent donc être prises. Par exemple : protection anti-incendie, copies de sauvegarde, installation de logiciel antivirus, changement fréquent des mots de passe, etc.). Les mesures de sécurité doivent être adaptées à la nature des données et aux risques présentés par le traitement.

 

7) Le principe de responsabilité

L’un des changements majeurs est certainement ce principe de responsabilité. Ce principe oblige les entreprises à documenter toutes les mesures et procédures en matière de sécurité des données à caractère personnel.

Cette documentation a pour objectif de démontrer la conformité des entreprises avec la règlementation en cas de contrôle de la CNIL. Cette mesure se traduit par l’obligation de tenue d’un registre des traitements. En effet, ce registre permet de constituer une base de données des traitements, mais pourra aussi servir à centraliser et à suivre toutes les démarches de conformité mises en œuvre par l’entreprise.

La suppression de l’obligation de déclaration préalable à la CNIL. Cette mesure traduit le principe qui gouverne le GDPR : responsabiliser les entreprises, en développant l’auto-contrôle.

Ce n’est plus à l’autorité de régulation de prouver que vous êtes en tort, mais à vous de prouver que vous êtes dans votre bon droit !

Visionnez la conférence GDPR & Big Data

À quelques mois de l’entrée en vigueur de la GDPR, les entreprises essaient encore de comprendre les mesures organisationnelles et techniques à mettre en place autour de leurs Big Data. Venez trouver les réponses à vos questions et balayons ensemble les actions à mener pour une mise en conformité du règlement.

GDPR : l’essentiel du règlement européen

GDPR : l’essentiel du règlement européen

Cet article est une introduction à la General Data Protection Regulation (GDPR) dans le cadre de vos projets Big Data.
Pour plus d’informations, téléchargez notre mini guide > GDPR : où en êtes-vous ?

Attention toutefois ! Il n’est pas destiné à être un conseil juridique, mais plutôt une remise à niveau sur les changements que la GDPR va apporter.

Les GDPR à définir

Données personnelles

Toute information relative à un être humain (ou à une personne concernée) qui peut être utilisée pour identifier directement ou indirectement cette personne.

Avec l’arrivée de la GDPR, cette définition a été élargie puisqu’elle comprend aujourd’hui les données online. Exemples: nom, photos, adresses e-mail, coordonnées bancaires, publications sur les réseaux sociaux, sites Web, informations médicales, adresses IP, données de localisation, etc.

 

Données sensibles

Ce sont les données à caractère personnel qui font apparaître, directement ou indirectement, les opinions politiques, philosophiques ou religieuses ou l’appartenance syndicale des personnes, ou qui sont relatives à leur santé ou à leur orientation sexuelle. Elles ne peuvent être traitées qu’avec un consentement explicite des individus.

 

Traitement des données

Ce large terme désigne toute opération effectuée sur des données à caractère personnel, via des moyens automatisés ou non. Figurent parmi les exemples de traitement la collecte, l’enregistrement, l’organisation, le stockage, l’utilisation et la destruction de données à caractère personnel.

 

Responsable du traitement

Le responsable du traitement est la personne qui détermine – seule ou conjointement avec d’autres – les finalités et les moyens du traitement de données (les méthodes de collecte et de traitement).

 

Les émergeants de la GDPR

 

Qui est concerné ?

  • Toutes les entreprises implantées dans l’Union Européenne et procédant au traitement de données à caractère personnel, quelle que soit sa taille.

  • Toutes les entreprises non implantées dans l’Union dès lors qu’elles procèdent à un traitement de données lié à des personnes situées au sein de l’Union Européenne.

Obligation de désigner un Pro

La GDPR prévoit la création d’un poste de Délégué de la protection des données (DPO). Ses missions seront :

  • contrôler le respect de la réglementation par l’entreprise ;

  • être le point de contact avec l’autorité de contrôle et les individus ayant des questions sur le traitement de leurs données personnelles ;

  • conseiller et informer l’entreprise, ses employés et les éventuels sous-traitants.

Responsabilité

Les entreprises doivent s’assurer d’être conforme aux obligations de la GDPR et être en mesure de démontrer le respect de ses principes.

 

Consentement valide

Le responsable de traitement doit être en mesure de démontrer que la personne concernée par un traitement de données a bien donné son consentement.

 

Notifications des violations

En cas de violation, l’entreprise est dans l’obligation d’informer leur autorité de contrôle, et si possible dans les 72 heures suivant sa découverte.

 

Protection de la vie privée dès la conception

Le responsable de traitement doit mettre en œuvre toute mesure de protection des données (pseudonymisation, minimisation, etc.) dès la conception ; c’est à dire, identifier les moyens de traitement.

 

Opposition au profilage

Toute personne peut s’opposer au traitement automatisé de ses données à caractère personnel dans le but d’évaluer certains aspects personnels relatifs à une personne physique (analyse, prédiction, etc.).

 

Portabilité des données

Toute personne concernée par le traitement de ses données peut obtenir, du responsable du traitement, une copie de ses données personnelles traitées et, le cas échéant, le transfert de ces données à un tiers.

 

Sanctions

La violation des principes de bases dont les conditions du consentement ou encore les droits des personnes concernées, seront sujettes à une sanction pouvant s’élever à 20 millions ou 4% du chiffre d’affaires mondial annuel.

GDPR : un fardeau supplémentaire pour l’industrie de la data ?

GDPR : un fardeau supplémentaire pour l’industrie de la data ?

L’inquiétude des entreprises sur les challenges de la mise en place de la GDPR est bien présente. Saurons-nous encore capable de faire du business à partir de mai 2018 ? Quels seront les impacts techniques et, surtout, financiers de cette mise en conformité ?

 

La GDPR, une zone de flou pour les entreprise

Avouons-le, il y a quand même un effet « bug de l’an 2000 » avec l’arrivée de la GDPR… Nombre d’entreprises perçoivent la GDPR comme un fardeau supplémentaire dans une industrie de la data qui est déjà loin d’être facile.

Celles-ci se trouvent dans une zone de flou pour implémenter cette réglementation et éviter les lourdes sanctions prévues pour les entreprises non conformes. Selon nous, elle dépendra fortement de l’interprétation de ces règles, de leurs applications et de la jurisprudence.

 

Oui, mais …

La GDPR doit être vue comme une opportunité d’atteindre une certaine maturité en terme de gouvernance et de maîtrise de la donnée. Il s’agit avant tout d’établir un contrat de confiance entre les data subjects et les responsables de traitements. C’est certain, ce contrat de confiance bénéficiera à tous !

 

Pour preuve, les particuliers sont plutôt réticents à donner des informations personnelles aux entreprises. De nombreuses études montrent que dans le cadre d’un nouveau deal, où des données personnelles sont délivrées dans une finalité bien précise et peuvent être redonnées ou supprimées à tout moment, les utilisateurs sont prêts à partager leurs données personnelles. C’est donc l’opportunité d’offrir des services à valeurs ajoutées aux clients, dans un mode « donnant donnant ».

Pour les organisations, la GDPR va apporter une plus grande confiance, ainsi qu’une meilleure réputation sur le traitement des données personnelles et donc plus d’engagement.

 

Repenser sa gestion des données

La GDPR c’est également l’occasion de faire un check up de la donnée dans les entreprises :

 

  • Nettoyer la mauvaise donnée.

  • Éviter la sur-acquisition (coûteuse) de données.

  • Mettre en place ou améliorer la gouvernance de la donnée.

  • Implémenter les bonnes pratiques autour d’initiatives Big Data et Data Science.

Ainsi, cette nouvelle maîtrise et gouvernance de la donnée entrainera de meilleurs enseignements à partir de cette donnée, et donc une meilleure création de valeur à partir de celle-ci.

 

Responsabiliser les entreprises

Que signifie finalement le jargon legal de la GDPR que nous avons détaillé dans notre série d’articles « GDPR – les bases légales » ? Il s’agit certainement de responsabiliser les entreprises sur les données utilisées. Cette réglementation implique alors de se poser les bonnes questions :

 

  • Quelles sont les données personnelles que je détiens ? Où sont-elles ?

  • Quelles sont les possibilités autour de ma donnée ?

  • Qu’est-ce que je fais avec mes données ?

  • Pourquoi je les collecte ?

  • Quel résultat je cherche à atteindre ?

Mettre en place des initiatives technologiques

Ainsi, l’arrivée de la GDPR fait émerger un certain nombre d’impacts dans nos organisations principalement juridiques et organisationnelles. Cette réglementation sera également l’occasion de mettre en place des initiatives technologiques dans les écosystèmes Big Data, qui certes aideront les entreprises à se mettre en conformité avec la régulation, mais qui auront une valeur intrinsèque. L’une des premières actions, selon nous, est de cartographier les données à caractère personnel utilisées et stockées au sein de votre entreprises. 

Les outils de Data Catalog peuvent être le début d’une réponse.

 

Visionnez la conférence GDPR & Big Data

À quelques mois de l’entrée en vigueur de la GDPR, les entreprises essaient encore de comprendre les mesures organisationnelles et techniques à mettre en place autour de leurs Big Data. Venez trouver les réponses à vos questions et balayons ensemble les actions à mener pour une mise en conformité du règlement.

GDPR : Êtes vous concernés par le règlement ?

GDPR : Êtes vous concernés par le règlement ?

En décembre dernier, nous nous sommes posés la question : Ce que la GDPR va changer dans le monde Big Data ? Dans cette série d’articles, nous revenons sur les aspects légaux explicités durant la conférence de la XebiCon’17.

 

Le périmètre d’application de la GDPR

Si La GDPR s’applique aux “Data Controllers” ou “Responsables des traitements”, à savoir les organismes qui déterminent les finalités et les modalités de traitement de données personnelles, elle s’étend au “Data Processor” ou “ Sous-traitant” également.

Les règles et obligations de la  GDPR s’appliquent au traitement – automatisé ou non – des données à caractère personnel.

 

Définitions des termes de la GDPR

Avant toute chose, mettons-nous d’accord sur la définition de ces termes :

Données à caractère personnel

La GDPR donne une définition précise des données à caractère personnel. Il s’agit de « toute information se rapportant à une personne physique identifiée ou identifiable ».

Par personne physique identifiable, il faut comprendre « une personne physique qui peut être identifiée, directement ou indirectement, notamment par référence à un identifiant, tel qu’un nom, une adresse postale, un mail, ou plusieurs éléments spécifiques propres à son identité physique, physiologique, génétique, psychique, économique, culturelle ou sociale ».

Une définition qui a donc été élargie puisqu’elle inclut désormais certaines données online telles que les données de localisation, les identifiants en ligne, les numéros d’identification (identifiants de terminaux, cookies, adresses IP, etc.).

 

Traitement de données

Ce large terme désigne toute opération effectuée sur des données à caractère personnel, via des moyens automatisés ou non. Figurent – parmi les exemples de traitement – la collecte, l’enregistrement, l’organisation, le stockage, l’utilisation et la destruction de données à caractère personnel.

Au final, l’immense majorité des entreprises européennes est concernée par les dispositifs de la GDPR.

 

Visionnez la conférence GDPR & Big Data

À quelques mois de l’entrée en vigueur de la GDPR, les entreprises essaient encore de comprendre les mesures organisationnelles et techniques à mettre en place autour de leurs Big Data. Venez trouver les réponses à vos questions et balayons ensemble les actions à mener pour une mise en conformité du règlement.