30 oct. 2011

Cuatro siglos de ciencia en internet.

¿Cómo ha conseguido la Royal Society abrir por completo su archivo histórico en internet?
Detrás del proyecto se encuentran muchos años de duro trabajo. La digitalización se ha llevado a cabo gracias a JSTOR, una organización sin ánimo de lucro afincada en Nueva York.
La participación de JSTOR se centró fundamentalmente en los artículos anteriores a enero de 1997, pues a partir de esta fecha la Royal Society comenzó a generalizar el uso electrónico de la información. Desde el primer número del Philosophical Transactions se digitalizaron exactamente 693.780 páginas, tanto texto como imágenes en alta resolución. En total, 1,2 terabytes de información.
Desde el punto de vista tecnológico, la digitalización aprovecha las ventajas del software de reconocimiento óptico de caracteres de manera que es posible realizar búsquedas de palabras específicas en los textos, indexarlo y simplificar la lectura en los e-readers. Sin embargo, aparecieron algunas dificultades en este proceso. Así, en los primeros artículos del Philosophical Transactions, que están escritos a mano, figuraba la s larga y otros caracteres tipográficos poco usuales. A ello se sumaba la profusión de textos en latín, francés e italiano. Como consecuencia fue necesario reescribir cerca de 40.000 páginas para que contaran con los estándares de calidad deseados. Sólo el control de calidad de la posdigitalización llevó 6.000 horas, a las que habría que sumar otras 6.000 para incorporar el software de reconocimiento óptico de caracteres.

No hay comentarios: