A la Une Actualités

Tout savoir sur le CAPTCHA

Depuis nos premières expériences sur Internet, nous croisons des CAPTCHA dans bien des situations. Pour s’inscrire sur un site, pour publier un message sur un forum ou à la fin d’un article, ou d’une manière plus générale, à la fin d’un formulaire. Il a pour missions de bloquer les entrées envoyées par des robots, visant à diffuser du spam. Aujourd’hui ce terme est une marque commerciale, non déposée par Google, mais par l’Université Carnegie-Mellon, située à Pittsburgh aux États-Unis.

CAPTCHA est l’acronyme de Completely Automated Public Turing test to tell Computers and Humans Apart. Son objectif: bloquer les action robotisées. En effet, le CAPTCHA est un test requis pour accéder à certains services sur Internet, qui consiste à saisir une courte séquence visible sur une image, afin de différencier les utilisateurs humains d’éventuels robots malveillants.

Le terme a été inventé en 2000 par Manuel Blum, Luis von Ahn, et Nicholas J. Hopper de l’Université Carnegie-Mellon, ainsi que John Langford un chercheur travaillant chez IBM.

Des premières traces dès 1996

Dans les 90, les forums sont les réseaux sociaux d’aujourd’hui. On y parle de tout, avec des internautes du monde entier. Cette période marque aussi la prolifération de messages que l’on peut qualifier de spam, déposés par des robots, destinés à ramener vers un site douteux, à déposer un lien, ou juste à nuire aux utilisateurs.

Rapidement, des chercheurs se penchent sur cette problématique, les filtres des sites web n’étant plus assez efficaces. L’idée est donc de créer un outil simple qui permette de distinguer un robot d’un humain. C’est en 1996 que Moni Naor dans un texte intitulé Verification of a human in the loop, or Identification via the Turing Test que les bases sont posées. Quelques mois plus tard, en 1997, Altavista utilise une version qui amorcera une véritable tendance. À cette époque, l’objectif est bloquer la surindexation de sites, dont beaucoup étaient ajoutés par des robots. Un problème se pose vite lorsque la détection des caractères à retaper devient simple et se fait automatiquement par les robots. Il est alors nécessaire de faire évoluer le concept.

Ainsi, la reconnaissance des lettres ou des chiffres doit être rendue quasiment impossible par un robot, souvent par de simples humains aussi. Plusieurs pistes sont lancées, avec des variations de couleur du fond, alternance de la casse (haute ou basse, majuscule ou minuscule), etc. C’est en 2000 que Manuel Blum, Luis von Ahn, Nicholas J. Hopper et John Langford créent une version aboutie, et rapidement utilisée par de grands acteurs du web, à l’instar de Yahoo à l’époque. L’approche de réécriture restera en place et sera très populaire jusqu’aux entrainement des intelligences artificielles.

En effet, d’autres acteurs du numérique, comme Google, ont eu pour idée de transformer le CAPTCHA que l’on connaissait depuis des années. La boite de dialogue est remplacée par une mosaïque présentant une image découpée, ou bien plusieurs images. L’utilisateur doit cliquer les mages sur lesquelles il voit tel objet, ou tel animal. Cette méthode est encore très utilisée sur bon nombre de site, sans que l’on ait tout de suite compris sa finalité : instruire une IA de reconnaissance d’image. Malin ! Aujourd’hui, les images les plus communes présentent des feux de tricolores, des voitures, ou des devantures de magasin, afin d’enrichir les moteurs de voiture autonome. D’autres alternatives de Google, appelées reCAPTCHA (2014) analysent le comportement de l’utilisateur qui n’a qu’une case à cocher. Le déplacement non mécanique de la souris prouverait à lui seul que vous n’êtes pas un robot.

Lire la suite

ARTICLES SIMILAIRES

Laisser un Commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient. Accepter En savoir plus

NEWSLETTER

Inscrivez-vous et recevez régulièrement des arletes par mail

Vos informations ne seront pas partagées