26 oct 2011

¿La transcripción automática del Archivo de Indias es factible?

Enrique Vidal es catedrático del Departamento de Sistemas Informáticos y Computación de la Universidad Politécnica de Valencia (UPV) y lidera un proyecto nacional en reconocimiento de formas y aprendizaje computacional, dos áreas clave en inteligencia artificial.
–¿Cómo puede aprender una máquina a transcribir mejor un manuscrito antiguo?
–La idea es que el sistema propone, por ejemplo, la transcripción de una línea de texto y si el operador detecta una palabra que no le gusta, lo indica, o la cambia. Esto es percibido por el sistema como una retroalimentación útil para corregir otros errores relacionados de la misma línea. Además, el sistema puede ir aprendiendo de sus errores y evitar repetirlos en el resto las siguientes páginas a transcribir. Este es el tipo de sinergia persona-maquina que estamos tratando de mejorar.

–¿Esa colaboración hombre-máquina hará que la transcripción sea cada vez más perfecta?
–Sí. El ejemplo típico de una aplicación sería transcribir una colección de libros, digamos entre 10.000 y 100.000 páginas. El proyecto puede empezar con un trabajo humano bastante intensivo pero, conforme va progresando, cada vez los humanos trabajan menos y al cabo de algún tiempo prácticamente lo hace todo el sistema. Esto nos gustaría que fuera extrapolable a proyectos como la transcripción del Catastro del Marqués de la Ensenada del siglo XVIII, que es un trabajo pendiente en España, o a la transcripción del Archivo de Indias, que es un enorme repositorio de texto manuscrito, que de hecho su volumen se mide en kilómetros de estanterías, de documentos puestos uno al lado del otro. El 99,9 % del Archivo de Indias está por transcribir.

–¿La transcripción automática del Archivo de Indias es factible?
–Hoy en día ya se puede transcribir, pero el resultado tiene tantos errores que no es muy útil. Por ello hace falta la intervención humana. Si la persona tiene que intervenir, lo importante es no ya conseguir el mínimo error, sino de lograr que el humano trabaje lo menos posible; y no hablamos ya de trabajo físico, sino de trabajo más bien cognitivo.

No hay comentarios: