“El almacén de la Historia”, una colección digital para la investigación historiográfica

Mirella Romero-Recio
mmromero@hum.uc3m.es
Universitad Carlos III de Madrid
María-Jesús Colmenero-Ruiz
Universitad Carlos III de Madrid
Victoria Rasero-Merino
Universitad Carlos III de Madrid
Jorge Morato
Universitad Carlos III de Madrid

Comunicación breve
Digitalización, creación de recursos


A continuación se presenta el proyecto Almahisto, acrónimo de “El almacén de la Historia”. Este proyecto está influenciado por el mismo contexto catalizador de las humanidades digitales en España como disciplina emergente que llevó asimismo al desarrollo del manifiesto por unas Humanidades Digitales ((http://tcp.hypotheses.org/487)) y la creación de la asociación Humanidades Digitales Hispánicas (HDH) en 2012. Aunque la Historia está integrada desde sus inicios en esta “transdisciplina”, su enfoque orientado al estudio de la historiografía es lo que lo hace novedoso.

Las raíces de este proyecto descansan en la investigación historiográfica, la cual es la razón de ser del Instituto de Historiografía “Julio Caro Baroja” de la Universidad Carlos III de Madrid ((http://portal.uc3m.es/portal/page/portal/inst_hist_julio_caro_baroja)). Tras la consolidación de una de sus líneas de investigación a través de varios proyectos, el equipo decidió abrir nuevas vías ampliando la investigación a todas las áreas de la Historia. Para lograrlo, se planteó la necesidad de preparar una base sólida para su estudio, mediante la recopilación y  anotación adecuada para el estudio historiográfico en una plataforma digital de acceso abierto. El proyecto tiene por tanto investigadores de las áreas afectadas: historiadores, documentalistas e informáticos.

Así pues, diseñar, elaborar y alojar en red un repositorio institucional de acceso abierto sobre recursos historiográficos fue el objetivo que inspiró el proyecto “El almacén de la Historia” (Almahisto)r. Se delimitó temporalmente entre el período que va desde la llegada de los Borbones al trono de España (1700) hasta el final de la Guerra Civil (1939). Las fechas de apertura y cierre que se han establecido marcan un cambio importante en la percepción, evolución e investigación de la Historia en España. Se pretende estudiar cuáles fueron los temas más recurrentes, las tendencias más comunes o los gustos de los estudiosos que se acercaron a cada etapa de la Historia entre 1700 y 1939. El conjunto de documentos recopilados y puestos a disposición para la comunidad se espera que facilite no sólo la investigación historiográfica sino también la labor docente. A partir de él se espera obtener en el futuro otros materiales docentes y de investigación.

La realización del proyecto tiene los siguientes requisitos:

  1. Pervivencia en el tiempo y accesibilidad a los recursos
  2. Accesibilidad y modularidad para su reuso
  3. Integrar puntos de vista de expertos creando un esquema de descripción consensuado.

Su  planificación supone acometer distintos grupos de tareas:

En esta exposición nos centraremos en las dificultades y soluciones encontradas en las primeras etapas de desarrollo del proyecto, principalmente en relación con su implementación técnica.

El proyecto preveía una imprescindible fase de búsqueda y definición de la plataforma más adecuada para el almacenamiento, descripción y puesta a disposición de los documentos que iban a ser seleccionados, según los criterios establecidos, para la creación del conjunto de interés para la investigación.

Durante ese periodo se presentó una oportunidad que constituía una variable no contemplada con anterioridad pero que satisface uno de los requisitos del proyecto, su perdurabilidad, mediante su integración en el repositorio electrónico de la Biblioteca de la Universidad Carlos III. Este repositorio institucional se conoce con el nombre e-Archivo ((http://e-archivo.uc3m.es/)). Está implementado con la plataforma DSpace. Este software está orientado fundamentalmente, y como tal suele usarse, hacia la gestión y administración de repositorios abiertos de documentos generados en el seno de la organización que lo administra y, en general, para documentos nacidos ya digitales. Estas características podrían dar la impresión de que es poco adecuada para el alojamiento y gestión del conjunto de materiales seleccionados para ALMAHISTO, cuyo propósito es muy distinto: elaboración de un corpus documental conteniendo registros con una descripción exhaustiva de cada uno de los documentos incluyendo enlaces a la fuente en la que se localiza el documento ya sea en formato impreso o digital. No es objeto del proyecto la recopilación y archivo de las obras, entre otros motivos, por limitaciones de derechos de autor. Sin embargo, existen razones que fundamentan su elección para nuestros fines:

a) En relación con la propia plataforma:

b) en relación con el servicio gestor:

En definitiva, la integración del proyecto en e-Archivo garantiza un respaldo de seguridad y estabilidad que difícilmente podría obtenerse de otro modo, además de aportar la experiencia que sus responsables han ido acumulando desde su adopción por la biblioteca.

Sin embargo, al lado de estas ventajas aparecen también las dificultades. Dspace utiliza, para el modelado interno de los metadatos asociados a los documentos que va a gestionar, un perfil de aplicación Library Application Profile ((http://dublincore.org/documents/library-application-profile/)) del conjunto original de quince elementos del esquema de metadatos Dublin Core (Dublin Core Metadata Element Set). e-Archivo utiliza el esquema de metadatos que proporciona Dspace, al que ha añadido algunos propios. Tras un análisis de esta estructura de metadatos ya existente, se comprobó que no era suficiente para representar en detalle la información descriptiva de documentos que requería el proyecto Almahisto. Por ello se ha diseñado un modelo propio más granular que contiene elementos de metadatos adaptados a la descripción establecida por los investigadores del proyecto. El valor asignado a estos metadatos puede tener dos categorías: texto libre o estar sujeto a un vocabulario controlado.

Aunque algunos metadatos disponen de conjuntos de valores de amplia distribución y uso otros requieren la búsqueda o desarrollo de vocabularios especiales, por ejemplo para poder describir hechos, lugares o períodos históricos.

La nueva versión de Dspace permitía incorporar identificadores de autoridades para su control (mediante VIAF) pero este módulo no ha sido posible integrarlo correctamente por lo que ha debido ser inhabilitado. No obstante, se están recogiendo los datos.

Otra preocupación al ir avanzando en el trabajo ha sido su utilidad futura en el contexto de la web actual, lo que nos ha llevado a pensar en la posterior exposición de los metadatos de la colección como Linked data ((http://www.w3.org/standards/semanticweb/data)). Para ello se han incluido metadatos extra para enlazar a otros vocabularios existentes, valorándose recursos para algunos de los metadatos más específicos como (http://pleiades.stoa.org/), un recurso que recoge información geográfica histórica sobre el mundo antiguo.

Dadas las características de Dspace la exposición directa de estos datos no es posible de momento, por lo que han de adoptarse otras estrategias. Una vez en marcha la colección sustentará la investigación historiográfica propiamente dicha, estudiando varios aspectos inicialmente previstos, como el cambio en la concepción historiográfica en esta época en cada área de la Historia, la importancia otorgada a los restos arqueológicos y la repercusión de la Historia en las diferentes áreas de la cultura y producción intelectual española (la música, la pintura, la arquitectura, las obras teatrales, la novela, la poesía o las guías de viaje). Sin embargo, esta fase estará en constante proceso de ampliación a medida que la investigación avance y vayan surgiendo nuevas preguntas o posibles aplicaciones a la investigación y la docencia.

La necesidad de equipos multidisciplinares para llevar a cabo este proyecto refuerza la comunicación y el descubrimiento entre los investigadores de las distintas áreas y el personal encargado del repositorio. Finalmente proporciona una base para su ampliación y muchas investigaciones futuras y al mantenerse el resultado en el tiempo en la institución, abierto a todos, permite la transferencia del conocimiento acumulado.