Blog Cyberjustice - CAPTCHA et reCAPTCHA : prouvez que vous n'êtes pas un robot

Tout le monde a probablement rencontré une authentification défi-réponse utilisée pour déterminer si l’utilisateur est un humain ou un robot. Ces tests sont appelés CAPTCHA et sont accompagnés de différentes formes et questions. Par exemple, lors de l’inscription à Facebook ou de la saisie des informations de carte de crédit sur des sites Web, nous pourrions être invités à copier et coller une série de mots afin de valider notre accès.

Selon, les informaticiens l’un des moyens les plus simples pour tester si un utilisateur est un humain ou une machine c’est d’utiliser des images de langage, car les CAPTCHA présentent des défis difficiles à réaliser pour les ordinateurs (taux de réussite de 0,01 seulement) mais relativement faciles pour les humains (taux de réussite de 80%).

Qu’est-ce que CAPTCHA ?

En 1996, un chercheur en informatique, Moni Naor, dans un texte intitulé « Verification of a human in the loop, or Identification via the Turing Test » présente l’idée de créer un outil permettant de distinguer un robot d’un humain. L’objectif était simple : bloquer les robots et les spams et rendre les forums qui représentaient les réseaux sociaux d’aujourd’hui un endroit plus sûr.

Quelques mois plus tard, en 1997, pour la première fois, un moteur de recherche du World Wide Web « AltaVista » a développé des premiers CAPTCHA primitifs pour empêcher les bots d’ajouter des sites à leur moteur de recherche.

La création du terme CAPTCHA en 2003 qui signifie «test de Turing public complètement automatisé pour séparer les ordinateurs et les humains » est associé au nom de l’informaticien Luis von Ahn. Les CAPTCHA se divisent en trois grandes catégories : à base de texte, à base d’image et à base d’audio.

Les avantages :

Les CAPTCHA empêchent les pirates d’utiliser des robots pour envoyer des e-mails de phishing, ils permettent de restreindre la création de plusieurs faux comptes à des fins malveillantes, de prévenir contre l’usurpation des sondages car ils permettent d’assurer que chaque vote soit saisi par un humain, ainsi que de bloquer les attaques des comptes en ligne grâce à plusieurs mots de passe différents.

Les inconvénients :

Malgré ses avantages, les CAPTCHA peuvent affecter négativement l’expérience utilisateur sur les sites car leur utilisation n’est pas toujours claire pour tout le monde. En outre, les CAPTCHA posent des obstacles aux utilisateurs ayant une déficience visuelle.

Qu’est-ce que reCAPTCHA ?

reCAPTCHA est un service gratuit de Google dont le but est de prévenir des spams et des abus sur les sites Web en distinguant les humains et les robots avec l’aide de la reconnaissance d’images du monde réel, grâce à des photos, des adresses de rue, des textes de livres imprimés, textes d’anciens journaux, etc. Il a été développé par les chercheurs de l’université Carnegie Mellon afin de remplacer les CAPTCHA traditionnels. En 2009, il a été racheté par Google, qui en 2014 a totalement simplifié d’utilisation des reCAPTCHA en ne demandant qu’un clic à côté de la déclaration « Je ne suis pas un robot » afin de valider l’accès des internautes. Ce test moderne de reCAPTCHA (« No CAPTCHA reCAPTCHA ») analyse le mouvement du curseur et décide si l’utilisateur est un robot ou un humain. De plus, l’analyse des cookies stockés sur l’appareil et son historique peuvent également révéler si l’utilisateur est effectivement légitime.

L’entraînement de l’IA de Google via reCAPTCHA

Une chose dont tout le monde n’est pas conscient, c’est que répondre aux tests reCAPTCHA de Google sert non seulement à distinguer les humains des robots, mais aussi à entrainer l’intelligence artificielle de l’entreprise. Par exemple, dans reCAPTCHA basé sur du texte, les utilisateurs ont demandé à écrire deux mots afin de valider leurs accès. L’un de ces mots est en effet un vrai test de l’ensemble de données de mots connus de Google. Cependant, le deuxième mot (le mot inconnu par Google) sert à la numérisation des livres et d’archives de presse ancienne. L’autre exemple est la reconnaissance d’image qui demande aux utilisateurs de choisir une photo d’un animal, d’une voiture ou d’un bâtiment. Ce test sert à la perfection du système de reconnaissance d’image de l’IA de Google. Autrement dit, plus les utilisateurs alimentent des images, plus l’IA devient précise pour sélectionner la même image parmi d’autres images.

Les critiques :

Le fait que Google tire parti des internautes grâce aux tests reCaptcha soulève un certain nombre de préoccupations et de critiques du public. Le 3 février 2016, la justice américaine a rejeté la plainte d’une requérante Gabriela Rojas-Lozano selon qui, Google obtenait du travail gratuit de ses utilisateurs, car il bénéficiait du temps et des efforts de ses utilisateurs à leur insu.

Quel sera l’avenir du (re)CAPTCHA ?

Malgré ses avantages, le CAPTCHA et le reCAPTCHA ne protègent pas toujours les sites par les attaqueurs et des spammeurs. Les cybercriminels sont de plus en plus sophistiqués et les CAPTCHA et le reCAPTCHA n’offrent parfois plus de protection contre les bots. Par conséquent, les spécialistes des technologies Web sont à la recherche d’un autre moyen pour détecter si un utilisateur est humain ou non.

Rafael ISMAYILOV

M2 Cyberjustice – Promotion 2020/2021

Sources: