Vous avez sûrement déjà croisé le système de vérification humaine reCAPTCHA qui permet de lutter contre le spam, en retapant 2 mots écrits dans un formulaire. Mais saviez-vous que ce système permet de manière astucieuse de numériser des milliers de livres papier grâce à votre propre contribution ? En effet, sur les 2 mots que vous tapez, un seul est connu et vérifié.
L'autre n'est pas connu, mais en le proposant à des centaines d'internautes différents et en ayant toujours la même réponse de leur part, le système sait alors que l'association entre ce qui a été scanné et ce qui a été tapé par les internautes est correct. Et voilà comment on arrive à numériser des milliers d'ouvrages avec un système antispam ! L'OCR (système de reconnaissance des caractères automatique par informatique) n'est aujourd'hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain, on arrive à de bien meilleurs résultats. Le slogan de la société (qui a été rachetée par Google) incarne bien le fonctionnement de ce système : "stop spam, read books".

Tous les commentaires (107)
@Zdouble, j'ai pas compris a 100% mais juste l'idee et je trouve sa fabuleux
Je sais pas vous, mais moi les captchat ça m'énerve quand on doit actualiser 3 fois pour réussir à avoir un mot correcte. Maintenant je saurais que je peux taper n'importe quoi haha
maintenant je vais écrire sans exactitude le deuxième mots pour arrêter de me casser la tête :p
Wahou ! Moi qui est passionné d'informatique, je trouve cet idée surprenante en effet il fallait y penser !
Le pire c'est que les vrais cobayes sont payés !
Moi aussi j'ai relu 2 fois, et j'ai toujours pas compris ce que tu veux dire ...
Effectivement, mais finalement puisque un seul mot sur les 2 est connu, vous ne pouvez taper que celui qui est connu. Ça va deux fois plus vite. Au début on se demande lequel s est puis ça vient avec l habitude.
On ne va pas travailler pour google quand même!
Cette anecdote m'angoisse... Sommes-nous manipulables à ce point, on nous trompe pour numeriser (parfois illegalement) des millions de livres ???
C'est extrêmement énervant les captcha grrrr j'evites des sites rien que pour ça
Très ingénieux ce monsieur bravo !!!
Jmcaumdt..(je me coucherais avec un mal de tête) ;)
J'avais lu sur leur site que ce n'était pas obligatoire. A mon avi, on peut en mettre partout sur son site (sans raison apparente) sans obliger la saisie des caractères affichés (ou si, si l'on est sadique).
Le fait est que ça ne passe pas par un seul utilisateur c'est sur un échantillon représentatif de je suppose une voir plusieur centaines de personnes :)
Merci beaucoup, nous voilà éclairés :)
En bref comme la machine ne reconnaît pas les caractères et qu'ils ne sont pas sur d'un mot ils nous demande jentillement de décoder ce mots sans vraiment nous le demander sinon personne ne le ferait c'est une perte de temp !
Ça t'angoisse toi de participer sans le savoir et avec un effort minime à la numérisation des livres, et contribuer ainsi à leur préservation ?
Merci beaucoup Vb73, tu a changé la vision de ma vie ! ;)
Il y a un très bon documentaire concernant justement un très grand debat entre les droits d'auteurs qui interfère avec les copies "injuste" de Google
Bah ... Ce soir JIMCB (j'irai me coucher bête) je ne saisi toujours pas :-( !
Merci j y arrivais pas. Pourtant je suis pas mauvais en informatique. Idée de génie d utiliser les millions d utilisateurs internet