¿Las puertas de lo imposible? POCRAM, una base de datos experimental en torno a la conversión religiosa en la longue durée. Problemas epistemológicos y posibilidades de análisis

Nicolás Perreaux
nicolas.perraux@orange.fr
Marisa Bueno
marisa.bueno@univ-nantes.fr
Université de Nantes
POCRAM
Université Paris Est-Créteil

Comunicación larga


La gran masa de datos digitalizados en los últimos años proporciona a los investigadores un fácil acceso a las fuentes y favorece la creación de nuevos métodos de análisis y tratamiento de datos que condicionan los resultados de la investigación histórica. Pero a pesar del gran número de datos disponibles hay que señalar la escasa utilización de los mismos en la construcción del discurso histórico. 

En la presente comunicación presentamos las reflexiones epistemológicas sobre las transformaciones de los métodos de investigación a partir de nuestras experiencias previas y que coinciden en un mismo proyecto de investigación: POCRAM, http://pocram.hypotheses.org. El objetivo es la construcción de una base de datos experimental en la que el análisis matemático y estadístico ofrezcan una visión complementaria a la construcción clásica del discurso sobre la conversión religiosa en su dimensión histórico-política.

La multiplicación exponencial de las fuentes disponibles permite analizar el corpus seleccionado a partir de otras variables a través de un diseño adecuado: curvas de frecuencia de un nombre, análisis lexicométrico y semántico que permiten analizar la migración del significado de conceptos como conversio, heresis, idolatría, religio, –entre otros-. Este tipo de análisis permitirá una justa aproximación a los conceptos y un análisis diacrónico de sus significados depurando los distintos significados históricos utilizados en la historia medieval y moderna. 

Así mismo la base de datos permitirá superponer diferentes y múltiples demandas que nos remiten a diferentes cronologías ilustrando la variación de uso de los conceptos y el análisis de las ideologías subyacentes en cada periodo. La creación de una base de datos múltiple, integrando distintas lenguas (latín, romance, francés, inglés) permite realizar al mismo tiempo exploraciones geográficas que son claves a la hora de comprender la arqueología de los discursos políticos.

Un proyecto de estas condiciones no está exento de dificultades que deben ser expuestas y analizadas: 

  1. Problemáticas relativas a la selección del corpus a analizar: amplitud cronológica del proyecto (desde la tardo antigüedad hasta el siglo XVIII); amplitud geográfica (contexto europeo en el periodo tardo antiguo y medieval, y la dimensión mundial en el periodo moderno), así como la pluridisciplinariedad del mismo (fuentes textuales, iconográficas…).
  2. Observaciones generales relativas a la distribución de fuentes documentales disponibles on-line por periodos. Las fuentes disponibles en modo txt.  son muy abundantes para el periodo tardo antiguo y para la alta edad media, debido a la existencia de experiencias  previas en proyectos de digitalización y análisis textual en estos periodos. Sin embargo a pesar de la abundancia de fuentes disponibles para la edad media y sobre todo para la edad moderna,  en la mayoría de los casos encontramos textos incompletos, traducciones o textos en modo imagen. Esta última cuestión nos confronta con la ardua tarea de la OCRsación de textos con los consabidos errores mecánicos y la necesidad de relecturas y correcciones. A pesar de la existencia de diferentes programas libres que permiten una primera conversión de los mismos, los resultados no son aptos para ser codificados directamente para su uso informático directo en proyectos de carácter científico.
  3. Clasificación temática de los recursos a utilizar. El volumen de textos a utilizar nos confronta a una reflexión temática relativa a la clasificación de los mismos, en principio inspirada en la tesis de Bruno Dumézil, Les racines chrétienes de l’Europe (Fayard, Paris,2005), que propone una articulación del corpus a través de diferentes marcadores temáticos:  textos teóricos (patrística, filosofía); normativa legal y eclesiástica; práctica jurídica;  textos narrativos (historias, crónicas, relatos hagiográficos); iconografía y arqueología, lo que provoca la distribución de las fuentes en diversos subcorpus con diferentes tratamientos en función de la naturaleza de los mismos. Si bien en principio la riqueza del corpus anima a la investigación, al mismo tiempo es altamente problemática, dataciones, corpus compuestos y la imprescindible limpieza de textos, lo que provoca una gran lentitud en el trabajo.
  4. Problemas técnicos, relativos a la selección del modelo de base de datos. Los modelos constituidos por fichas temáticas o por selección puntual de textos, constituyen un modelo en auge por su mayor flexibilidad. Estas bases de datos constituyen repositorios de fuentes que el historiador y el gran público pueden utilizar, si bien las posibilidades de análisis de concurrencia son limitadas. Los programas que incluyen modelos matemáticos y estadísticos provocan unas mayores dificultades técnicas y una fuerte interdisciplinariedad entre el campo de las ciencias humanas y la programación informática, son fuertemente experimentales y permiten una riqueza en el análisis que abre las puertas a otra dimensión epistemológica  modificando en muchos casos los resultados de la investigación histórica, ya que posibilitan el tratamiento de un mayor número de datos que solo pueden ser analizados matemáticamente y posteriormente analizados en clave histórica.
  5. Presentamos también los problemas a los que nos hemos visto confrontados a la hora de la selección de plataforma para albergar el proyecto: Telma (IRHT); ARTFL (Universidad de Chicago), www.lib.uchicago.edu/efts/ARTFL/philologic, Txm, ENS- Lyon II,  textometrie.ens-lyon.fr; CWB, desarrollada en las Universidades de Osnarbrück y  Lancaster, cwb.sourceforge.net.

El objetivo de la comunicación, no es otro que participar en la discusión teórica científica de esta reunión, presentando  los problemas a los que nos hemos visto confrontados en el desarrollo de una herramienta digital de estas características, donde las decisiones tomadas condicionan los resultados y abren campos y puertas en la investigación que aún están sin explorar.