Connect with us

O que está procurando?

TecnoetcTecnoetc

Destaque

Você sabia que resolvendo captchas você está ajudando a digitalizar milhares de livros?

Você sabia que resolvendo captchas você está ajudando a digitalizar milhares de livros? Veja mais detalhes em:

Hoje em dia é quase impossível navegar na internet sem esbarrar em um captcha. Apesar deles aborrecerem muita gente, eles estão ajudando a digitalizar milhares de livros!

O captcha é um sistema utilizado para evitar que bots (ou robôs) criem contas falsas, baixem arquivos ou acessem sites indevidamente. Como as palavras estão embaralhadas ou distorcidas, nenhum sistema de bots simples consegue identificar os caracteres e por isso consegue barra-los.

O melhor e mais conhecido sistema de captchas é o reCAPTCHA, que atualmente pertence ao Google. Recentemente o site começou uma campanha bem interessante que alia os captchas com a literatura.

Inicialmente, milhares de livros são digitalizados por um sistema automático. Boa parte das palavras é identificada automaticamente através de OCR (Optical Character Recognition – Reconhecimento Óptico de Caracteres), mas isso nem sempre funciona tão bem. Ainda existem dezenas de milhares de palavras que o sistema não consegue identificar e por isso tem que ser “traduzidas” manualmente.

E é aí que o captcha entra. As palavras erradas são identificadas e um outro sistema transforma essas palavras nos captchas e as pessoas vão traduzindo.

“Ok, mas como isso funciona exatamente? Como o sistema vai proteger os sites e traduzir ao mesmo tempo?” É aí que entra o sistema duplo de palavras. Aleatoriamente você pode pegar um desses captchas de tradução (meio que não tem como saber) e uma das palavras não é verificada, pois é ela que está sendo traduzida.

“Mas e se eu escrever errado?” Não tem problema também, pois cada palavra é verificada milhares de vezes, então as respostas mais comuns são identificadas como a palavra correta, correspondente ao que aparece no captcha. Além disso, existe também uma verificação humana na hora de finalizar a digitalização.

Cerca de 200 milhões de captchas são resolvidos todos os dias, o que reduz cerca de 150 mil horas de trabalho de tradução todos os dias!

Viu que legal? Então nada de reclamar da próxima vez que você vir um captcha. Você estará ajudando a fazer um mundo melhor. :-)

Advertisement. Scroll to continue reading.
Comments

Advertisement