Fairy Tail x Rave (2013) | Idol K-pop Pria dengan Follower Instagram Terbanyak | Pacific Rim: Uprising

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.
Pour en savoir plus et paramétrer les cookies… Fermer

publicité
RGPD, le dossier pour tout comprendre

RGPD : comment choisir entre anonymisation et pseudonymisation des données ?


Réglementation : Souvent confondues, l’anonymisation et la pseudonymisation constituent deux techniques de protection des données personnelles qu’il convient d’évaluer dans le cadre du RGPD. La première offre une sécurisation accrue et la seconde davantage de souplesse.

Le futur règlement européen sur la protection des données personnelles (RGPD) qui entrera en vigueur avant la fin du mois préconise différents dispositifs techniques pour préserver la vie privée des citoyens européens. Le texte évoque notamment l’anonymisation et la pseudonymisation des données. Deux moyens de masquage des données souvent confondus, à tort.

 

 L’anonymisation est un processus irréversible qui consiste à changer le contenu ou la structure même des données. Toutes les informations directement ou indirectement identifiantes sont supprimées ou modifiées, rendant a priori impossible toute réidentification des personnes. Sur le papier, l’anonymisation représente le niveau maximal de protection. 

Manager avant-vente chez Gemalto, Jan Smets met toutefois un bémol. Intéressante au départ, la méthode, reste, selon lui, difficile à mettre en œuvre dans la mesure où plus le volume de données croît plus les risques de réidentification par recoupement sont importants. « Des informations totalement anonymisées peuvent conduire à l’identification d’une personne en fonction du comportement relevé dans les informations, comme les habitudes de navigation sur internet, les historiques d’achats en ligne. »

Jen Smets prend l’exemple d’un responsable de traitement qui a anonymisé les données d’Etat-civil (nom, prénom, date de naissance, adresse) d’une dénommée Sophie tout en suivant ses habitudes. Il sait qu’elle se rend tous les matins sur le même site d’information, consulte ses mails quatre fois par jour et aime commander tous les jeudis son déjeuner au restaurant au coin de la rue. Des éléments qui, une fois recoupés, peuvent remonter jusqu’à Sophie.

Une réidentification possible par recoupement

Cette inquiétude est partagée par Jean-Guy de Ruffray, « counsel » au cabinet d’avocats Altana. Il estime également que le recoupement de deux collectes peut faire apparaître des données sensibles, ou bien réidentifier des individus dont les données avaient été pourtant anonymisées. 

C’est sur ce fondement que ma Cnil a refusé la demande d’autorisation de JCDecaux de collecter les adresses Mac des smartphones des passants du parvis de La Défense dans un rayon de 25 mètres autours de ses panneaux publicitaires afin d’en mesurer leur audience. Dans sa délibération, l’autorité de contrôle a mis en doute l’efficacité de la solution d'anonymisation proposée rappelant que celle-ci « doit empêcher toutes les parties d'isoler un individu dans un ensemble de données ». En février 2017, le Conseil d’Etat lui a donné raison.

De son côté, le G29, le groupe des « Cnil » européennes conseille au responsable de traitement mettant en œuvre des solutions d’anonymisation, « d’effectuer une veille régulière pour préserver, dans le temps, le caractère anonyme des données produites. » Une anonymisation, garantie à un jour donné, n’étant pas nécessairement assurée dans la durée à l’heure du big data et de l’intelligence artificielle. 

Une bonne solution d’anonymisation doit, aux yeux du G29, reposer sur trois critères : l’individualisation (est-il toujours possible d’isoler un individu ?), la corrélation (est-il possible de relier entre eux des ensembles de données distincts concernant un même individu ?) et l’inférence (peut-on déduire de l’information sur un individu ?).

La pseudonymisation, une alternative promue par le RGPD

En raison de ces griefs, la pseudonymisation peut être une alternative à l’anonymisation. A la différence de cette dernière, il s’agit d’un processus réversible qui consiste à remplacer un attribut par un autre au sein d’un enregistrement. La pseudonymisation est une technique privilégiée dans les projets où l’identité d’un individu n’est pas essentielle notamment dans les expérimentations en data science. 

Le RGPD fait à plusieurs reprises la promotion de la pseudonymisation. Dans son article 25, le règlement cite nommément la pseudonymisation parmi les mesures techniques et organisationnelles appropriées pour la protection des données que doit mettre œuvre le responsable du traitement. Plus simple à mettre en œuvre que l’anonymisation, la pseudonymisation permet de se conformer aux nouveaux principes de protection dès la conception (privacy by design) et de protection par défaut (privacy by default).

Pour Jen Smets, l’unique point faible de la pseudonymisation c’est la clé d’identification qui établit le lien entre les données pseudonymisées et l’identité des personnes auxquelles elles se rapportent. Pour que cette clé ne tombe pas entre les mains d’individus mal attentionnés, l’entreprise doit mettre en place les solutions de sécurité adéquates avec un contrôle d’accès robuste.  

Dans une fiche pratique sur la sécurité des données, la Cnil conseille « de générer un clé secrète longue et difficile à mémoriser (une combinaison de caractères aléatoires), puis d’appliquer une fonction dite à sens unique sur les données (par exemple, un algorithme de hachage à clé secrète tel HMAC). » En l’absence de besoin de réidentification, la Commission conseille de réduire les risques en supprimant tout simplement cette clé secrète. 

  • A lire, notre dossier

RGPD : tout pour être prêt le 25 mai 

Articles relatifs

Contenus sponsorisés

Contenus partenaires

Réagissez à l'article

Connectez vous ou Enregistrez-vous pour commencer la discussion
publicité