Le “data poisoning” ou “l’obfuscation” est une pratique consistant à publier des informations inexactes ou partiellement fausses, aux fins de dissimuler les données pertinentes sur sa vie privée. Si certains internautes recourent à l’obfuscation pour échapper à la surveillance et au profiling des grandes entreprises du web et notamment des GAFAM, cette technique peut également servir des buts plus néfastes.
Perturber le modèle économique des GAFAM
Le data poisoning part d’un principe : troubler et tromper les grands opérateurs de plateforme en ligne en s’attaquant aux ressources qui sont à la base de leur modèle économique, à savoir les données des utilisateurs.
Les stratégies économiques des géants du numérique reposent sur l’enregistrement des données des internautes et sur l’association des profils de ces derniers, avec les mots clés qu’ils recherchent lors de l’utilisation des différents services en ligne.
En ce sens, les GAFAM disposent d’informations précieuses sur les habitudes, goûts et envies de leurs abonnés. Ils vont en tirer profit en les assaillant de publicités ciblées, en contrepartie d’une rémunération abondante des annonceurs publicitaires.
Ce modèle économique est extrêmement fructueux pour les entreprises mais tout autant intrusif pour les internautes dont le moindre élément de leur vie privée est passé au crible.
Un moyen de résistance et de protection de la vie privée
Seulement certaines personnes s’opposent à ce que leurs données personnelles profitent aux GAFAM et ce au détriment de leur intimité. Ils ont ainsi décidé d’empoisonner leurs données.
En recourant au data poisoning, ces utilisateurs se servent du moyen de résistance le plus dommageable pour les GAFAM, puisqu’ils trompent les algorithmes de recherche en leur fournissant des données paradoxales.
Autrement dit, l’obfuscation revient à indiquer à l’algorithme que l’on est en faveur de deux centres d’intérêts complètements différents (activités, idéologies, courants politiques…). Ainsi l’intelligence artificielle deviendra inapte pour déduire les goûts de celui se trouvant derrière le profil numérique analysé.
Ce faisant l’empoisonnement des données est devenu un moyen de lutte contre la surveillance en ligne omniprésente, mais aussi un moyen garantissant la confidentialité de sa vie privée, sans devoir cesser d’utiliser internet.
Cette technique questionne alors sur la nécessité de reconnaître un droit de mentir sur ses données personnelles au côté du droit à la limitation, à la modification et à la suppression ?
Les cyber-risques du data poisoning
Seulement, le data poisoning peut aussi être utilisé comme une arme dans le cadre de cyberattaques, notamment en matière de sabotage industriel. Or, à mesure que les algorithmes de machine learning se perfectionnent et accumulent des données, l’émergence de cyber-risques croît dans le même temps.
En effet, les systèmes de recommandation produits par les algorithmes peuvent être aisément sabotés ou manipulés par les actions d’une multitude de “trolleurs” ou par l’emploi de “click farms”.
La problématique étant que, lorsqu’un système de recommandation est intoxiqué par des données antagonistes, celui-ci classe les données de manière chaotique. Cela implique, par conséquent, d’entraîner à nouveau l’IA en identifiant les données néfastes insérées et les purger.
Par analogie, on peut aussi considérer que laisser en masse des avis négatifs sur la page google d’un restaurateur ou d’un propriétaire pour nuire à son activité, s’apparente à du data poisoning. De même pour la rédaction massive de hashtags servant de rampe de lancement à des fake news pour arriver en “tendances” sur les réseaux sociaux et faire gagner encore plus de poids à la désinformation.
Dans ces cas de figure, l’idée d’instaurer un droit de mentir sur ses données est remise en perspective, car ce dernier pourrait entrainer un effet pervers, à savoir la légitimation de la mauvaise foi lors de la fourniture de données…
Léo Détoisien – M2 Cyberjustice – Promotion 2021/2022
Sources :
https://www.lebigdata.fr/data-poisoning