reCAPTCHA, serviço gratuito que ajuda digitalizar livros velhos

04.08.08 - 3:52 PM Ester Castro






reCaptcha

Não sei se alguém lembra, mas o pessoal que participou recentemente da última promoção, teve que passar por um CAPTCHA pra concluir o cadastro. O que eu usei foi o reCAPTCHA, por uma razão muito simples.

Antes de continuar e a título de informação, o Completely Automated Turing Test To Tell Computers and Humans Apart ou CAPTCHA é um programa desenvolvido para testar se o usuário é humano ou um computador. Somente humanos podem ler as palavras distorcidas do CAPTCHA e fazendo uso dele, sites, blogs, fóruns, portais, etc. podem previnir-se contra spam e máquinas espertinhas. O programa foi criado em 2000 por uma equipe da Carnegie Mellon University, tendo sido usado pela primeira vez pelo Yahoo.

Pois então. O que talvez uma minoria não saiba é que ao usar o reCAPTCHA, projeto criado pela School of Computer Science, o usuário estará ajudando a digitalizar livros para o Internet Archive. As palavras que aparecem aleatoriamente e distorcidas fazem parte na verdade de scans de livros velhos. E quando a palavra em questão é digitada, ela é automaticamente digitalizada. Portanto, ao estimar-se que cerca de 60 milhões de captchas são resolvidos diariamente em todo o mundo e que cada pessoa gaste cerca de 10 segundos nisso, totalizando mais de 150 mil horas que estariam sendo trabalhadas num único dia, não fica difícil aceitar que isso realmente funcione.

Stop Spam. Read Books. Esse é o lema do reCAPTCHA. Um projeto que defende a preservação da literatura. Super bacana isso.

;)









Confira outras postagens no blog!

2leep.com


Os comentários são via Facebook, portanto precisa estar "logado" para comentar. Vale lembrar que o teor dos mesmos são de inteira responsabilidade do comentarista.

Comente!! Assim saberei o que você pensa! ;)




  1. 16, novembro, 2009 em 20:33 | #1

    Que massa! Já gostava do plugin, mas não sabia desse objetivo por detrás. Vou continuar e espalhar o uso!

  2. 18, maio, 2009 em 16:06 | #2

    Ah, eu estava com a mesma dúvida que o Vladimir e Breno. Obrigado pela explicação na postagem acima Ester Beatriz. Muito esclarecedora. Agora só preciso conseguir fazer ele funcionar em todos os formulários no Joomla! através de uma extensão ou plug-in :0)

  3. Breno
    6, agosto, 2008 em 20:03 | #3

    Nossa, Ester. Agora eu estou me achando bêsta por não ter entendido. Tão simples!

    Legal, mesmo!

  4. 4, agosto, 2008 em 19:20 | #4

    Serviço super moderno hein amiga?! E o mais legal , um trabalho voluntário. Achei super interessante, indo visitar o site.

    Beijos

  5. 4, agosto, 2008 em 18:43 | #5

    Haha bem diferente, curioso e interessante!

    Conheço o reCAPTCHA mas nunca tinha visto isso.

  6. 4, agosto, 2008 em 18:14 | #6

    Vladimir e Breno.

    Entendo perfeitamente a dúvida de vocês. No site do reCAPTCHA explica direitinho como funciona, mas vou tentar traduzir pra vocês.

    Como eu disse os livros são escaneados. E através de um "reconhecedor óptico de caracteres" que eles chamam de OCR, as imagens de texto são convertidas em texto. Mas como o OCR não funciona perfeitamente, algumas palavras são reconhecidas erroneamente, ou seja, ele não consegue ler e reproduzir a palavra corretamente. E são estas palavras que são enviadas para a web em forma de captcha para que "humanos" possam reproduzir de forma correta.

    Ahh, mas se o OCR não consegue decifrar a palavra como ele irá identificar se o captcha foi "resolvido" corretamente?

    Segundo o site, cada nova palavra que não foi lida corretamente pelo OCR é dada ao usuário em conjunto com outra palavra pela qual a resposta já é conhecida. O usuário tem que responder as duas palavras. Se ele resolver aquela palavra que já é reconhecida pelo sistema e a outra não, fica subentendido que a outra palavra também está correta. O sistema então fornece essa imagem para um outro número de pessoas, para determinar com maior confiança, se a resposta original estava correta.

    Bom… é mais ou menos por aí.

    Espero que tenha ficado mais claro! ;)

  7. Breno
    4, agosto, 2008 em 18:00 | #7

    A minha dúvida é a mesma do Vladmir. Se o Captcha não foi "resolvido" por ninguém, como vai saber se a palavra refere-se à imagem mesmo? Ou então, qualquer coisa que eu escreva ele vai aceitar, o que tira a função primordial e ainda atrapalha na parte da digitalização dos livros.

    Sei lá, pode ter algum detalhe que não entendi.

    Um beijo

  8. Vladimir
    4, agosto, 2008 em 16:19 | #8

    Estranho, como o CAPTCHA vai saber se o q vc digitou é correto ou não pra poder autenticar??? não precisa q a imagem ja esteja associada a um texto para q este seja comparado ao q o usuario vai digitar!?

    Votz fica ai minha duvida!

  9. Gil
    4, agosto, 2008 em 14:47 | #9

    Nossa, muito legal essa dica, não sabia que eles tinham tido uma idéia tão boa. Para eu, que trabalho com programação, é sempre bom saber dessas idéias criativas que o pessoal tem por aí.

    O problema é que estamos trabalhando de graça! Hahaha, brincadeirinha.

    Beijos!

  10. 4, agosto, 2008 em 13:40 | #10

    Que louco!! Não sabia que rolava um motivo nobre atrás do bloqueio de spams. Muito bom!

Fechado para comentários.