Vous avez sûrement déjà croisé le système de vérification humaine reCAPTCHA qui permet de lutter contre le spam, en retapant 2 mots écrits dans un formulaire. Mais saviez-vous que ce système permet de manière astucieuse de numériser des milliers de livres papier grâce à votre propre contribution ? En effet, sur les 2 mots que vous tapez, un seul est connu et vérifié.
L'autre n'est pas connu, mais en le proposant à des centaines d'internautes différents et en ayant toujours la même réponse de leur part, le système sait alors que l'association entre ce qui a été scanné et ce qui a été tapé par les internautes est correct. Et voilà comment on arrive à numériser des milliers d'ouvrages avec un système antispam ! L'OCR (système de reconnaissance des caractères automatique par informatique) n'est aujourd'hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain, on arrive à de bien meilleurs résultats. Le slogan de la société (qui a été rachetée par Google) incarne bien le fonctionnement de ce système : "stop spam, read books".

Tous les commentaires (107)
En gros pour mettre des livres sur ebooks il faut retrouver les mot que des logiciels déchiffrent sur les livres papiers et quand le logiciel arrive pas a lire plutôt que de payer un mec pour le lire ils le mette en tant qu'anti spam et ils mettent un mot qu'ils connaissent pour savoir si c'est bien un homme qui déchiffre et ils mettent un mot qu'ils connaissent pas pour que ce soit nous qui le déchifrions puis pour être sûre ils comparent les réponses comme ça ils font des économies et ils évitent les spams
C'est ce qui est écrit en simplifié
PS : moi g compris que le commentaire de vb73 c'est l'anecdote qui n'est pas très claire
En gros des mec prennent du temps à inventer des sistèmes pour que Google les rachètent derrière en gros c comme si toi tu bossait et que c'était ton voisin qui était récompensé c'est super injuste et sa me donne un peu l'impression que Google n'as pas d'ingénieurs mais un gros compte en banque
Merci je viens de tout comprendre grâce a toi :)
On travaille pour Google et on n'est pas payé? Inadmissible!
Sinon, on pourrait écrire n'importe quoi sur les mots non reconnus? :o
Merci j'ai enfin compris
Merci pour le commentaire, j'ai enfin compris!
Chapeau à celui qui a eu l'idée de créer ca c'est très ingénieux ! Sachant qu'on me met une captcha a chaque téléchargement j'ai bien du numériser trois quatre livres ^^
C est pour ça que defois je tape un mot en me disant : what the f**k !? Et que le captcha valide .
Ah Ok, c'est le machin pour la sécurité... Content d'avoir contribué inconsciemment et de façon répété à la transmission future de notre savoir! C'est pas bête comme système, dommage que l'anecdote ne soit pas compréhensible(je l'ai lu plusieurs fois, fait des graphiques, des analyses de texte, des statistiques, mais elle est belle est bien incompréhensible...)
Merci beaucoup j'avais rien compris ! ;)
Moi non plus!!!!
En gros même si je lis "pomme" et que j'écris "cerise" ça va l'accepter car il n'attend pas une réponse "juste" mais un mot pour pouvoir comparer aux autres
Ah d'accord. Et pourquoi ils créé pas un captcha auquel est associé une réponse et si la réponse n'est pas bonne ça ne passe pas?
Au passage c'est cool l'OCR mais c'est très approximatif (comme pas mal de service Google en fait) et interchange souvent les i et les l et les remplacé même des fois par des virgules.
Oui mais vu que tu seras le seul à avoir écris "cerise" et que le premier mot est connu et vérifié par l'OCR, c'est quand même acceptable.
Merci !
Et la physique quantique est simple alors selon toi lol
De ce que j'en ai compris, les mots qu'on voit et qu'on a à taper dans le formulaire sont extraits de livres papier. En le voyant et le tapant, ça permet de "valider" le mot qu'il y a sur la photo. Ainsi, en voyant la photo d'un mot, en le tapant (parce que, à priori, on sait lire), on numérise ainsi le mot. Si je me trompe, corrigez moi.
intéressant mais j'ai rien compris !! lol
Je t'explique tu a 2 mots a déchiffrer. Le 1er est connu par le logiciel et il vérifie que tu n'est pas un robot. Pour le 2eme, ta réponse est enregistrée par le logiciel et sert a déchiffrer des bouquins grâce a un robot! Si la plupart des utilisateurs donnent la même réponse, les robots qui retranscrivent des livres se servent de leur réponse pour réécrire des bouquin papier sur des pc
en gros on travail gratuitment.et est ce que c'est légale???