Hoy de casualidad me topé con reCAPTCHA (me contactó uno de los desarrolladores porque está usando eventxx =), una de las mejores ideas que vi en los últimos tiempos.

La idea es aprovechar la increíble cantidad de horas-hombre invertidas en resolver captchas y convertilas en algo útil, como en un OCR distribuido con tracción a sangre, para pasar a formato digital libros antiguos disponibles en el grandioso Internet Archive.

El problema con los OCR (y voy a decir más o menos lo mismo que dice la página de reCAPTCHA pero en criollo), es que no siempre pueden reconocer todas las palabras, por lo que hay que corregir los textos escanneados (cualquier que haya tratado de usar un OCR es su vida sabe esto). Este trabajo tiene que ser hecho por un humano, y por que no aprovechar los captchas, que se tratan justamente de eso! De reconocer palabras deformadas que un OCR no pueda reconocer!

Se preguntarán entonces, como puede saber reCAPTCHA si lo que ingresa el usuario es correcto o no, si justamente no conoce la respuesta? Simple, ponen 2 palabras en el captcha, una conocida y una a escannear. Si la palabra conocida está bien, asumen que la desconocida también (aunque la reutilizan en otros captcha para ver si coinciden y poder determinar si el escanneo fue correcto con un poco más de certeza).

La idea me pareció tan buena, que mazziblog ya cuenta con reCAPTCHA gracias a su plugin para WP, (tienen varios otros), aunque realmente no estabamos con problemas de spam, pero es una buena causa =). Pruebenlo! Ayuden a escannear libros! Comenten!

Una Respuesta a “Haciendo algo constructivo con el spam”

  1. Sagar Dijo:

    Me encantó.
    Yo no lo voy a usar porque justamente el último post de mi blog es para que caiga spam!
    pero me parece una idea fantástica.. (por que rayos no se me ocurren esas cosas?)

    Muy bueno el blog.
    No sigan asi, intenten postear mas seguido.

Comentar este post