Hace meses ya hablábamos de ello. Las computadoras pueden descrifrar los caracteres de documentos digitalizados usando los programas de reconocimiento óptico de caracteres (OCR). Pero el OCR no es perfecto, o al menos no es comparable con el ojo humano. ¿Qué tal si hacemos que la máquina aprenda a partir de la experiencia humana? Hagamos que las personas nos descrifren las palabras que el OCR no pudo resolver...
Precisamente las webs cuentan con un sistema que sirve para identificar que la persona que rellena un formulario (por ejemplo, de registro en el sitio) no está usando un robot para hacer múltiples peticiones y abusar del servicio. Uno de estos sistemas se llama ReCaptcha y páginas como Facebook.com y Ticketmaster.com lo usan cuando una persona quiere inscribirse en el portal. En ese momento se le muestran al usuario dos palabras que proceden de libros que se han intentado digitalizar y que el OCR no pudo resolver. on este simple gesto, los internautas están ayudando, sin saberlo, a mejorar la digitalización.
No hay comentarios:
Publicar un comentario