El uso de herramientas terminológicas como estrategia para la difusión web del patrimonio cultural

Mª Dolores Olvera-Lobo
molvera@ugr.es
Universidad de Granada
Juncal Gutiérrez-Artacho
juncalgutierrez@ugr.es
Universidad de Granada
Comunicación larga Corpora y lingüística del corpus

El crecimiento de la Web 2.0 ha ido en paralelo al de la propia Internet y ha supuesto un cambio social, no solo porque ofrece nuevas herramientas que multiplican las formas en las que se genera y distribuye el conocimiento, sino también porque modifica el medio a través del cual los individuos se comunican con el entorno. Si bien la denominada Web 1.0 se limitaba a ofrecer información, en la actual Web 2.0 (ya se habla además de Web 3.0 y 4.0) el contenido de los sitios web depende, en gran medida, de la información aportada por los usuarios, lo cual fomenta la interacción, la participación y la creación de redes sociales o comunidades (O’Reilly, 2007). Además, se convierte en una plataforma de información constantemente mejorada por una comunidad que no cesa de incorporar contenidos y en la que se aprovecha la inteligencia colectiva para producir un importante volumen de datos de gran valor.

En este contexto, los diferentes agentes y organismos existentes en torno al patrimonio histórico-artístico, como ya ha sucedido en otras áreas similares, se enfrenta a unos cambios muy importantes para asegurar su difusión. Como ejemplo, cabe mencionar el hecho constatado de que el público interesado en conocer y visitar los bienes de interés patrimonial cada vez más, cuenta con un importante protagonismo y autonomía a la hora de preparar sus viajes (Olvera-Lobo & Gutiérrez-Artacho, 2014). Ciertamente, los usuarios no sólo localizan información en buscadores web y en portales turísticos, sino que se dirigen a comunidades y redes sociales indagando en las opiniones de otros usuarios, comparando precios, organizando su viaje, y compartiendo sus propias experiencias con el resto de usuarios. Por su parte los responsables, los organismos y las instituciones encargados de la gestión de los bienes inmuebles deben aprovechar la propia evolución de la red, que se basa en la colaboración y la socialización de la información (Alonso Almeida et al., 2008; Olvera-Lobo & Gutiérrez-Artacho, 2012; Olvera-Lobo & Gutiérrez-Artacho, 2014), lo que permite al usuario tomar el control de la situación.

El objetivo general de la investigación realizada es contribuir al debate acerca del desarrollo de herramientas en el contexto del acceso a la información web para aumentar su visibilidad. Para ello, nos planteamos como objetivos específicos incidir en el papel fundamental de la Web como plataforma para la difusión de información especializada multilingüe; apoyar la idoneidad del uso de herramientas terminológicas para facilitar el acceso a la información de sitios web (monolingües, bilingües y/o multilingües) y su visibilidad; y, presentar una propuesta de integración de información terminológica en sitios web especializados en patrimonio cultural. Como ejemplo de aplicación tomamos el sitio web bilingüe del Patronato de la Alhambra y el Generalife (Granada).

En efecto, desde hace años, el recinto monumental de la Alhambra constituye el monumento más visitado de España, con casi dos millones y medio de visitantes anuales. Es indiscutible su relevancia turística y económica, y no sólo desde una perspectiva local o regional, sino incluso nacional. Desde el punto de vista terminológico destaca la riqueza léxica de los diferentes elementos que conforman esta ciudad nazarí así como los relacionados con las múltiples actividades colaborativas que desarrolla el Patronato de Alhambra junto a numerosos organismos culturales a nivel nacional e internacional.

Partiendo de la información recogida en el sitio web del Patronato de la Alhambra se llevó a cabo la extracción y análisis de dicho corpus. Éste estaba constituido por muy numerosos archivos en muy diversos formatos —HTML, PDF, jpg, etc.—, y casi setenta mil palabras en español e inglés. El análisis textual incluyó un proceso de tokenización o segmentación en el que se adoptaron decisiones relativas a la separación de palabras —carácter espacio, punto, comas, etc.—, al tratamiento de los caracteres especiales —albercn—, de los acentos, de los números, la detección de sintagmas y grupos nominales —nombres propios y expresiones multipalabra— o la selección de mayúsculas/minúsculas. El análisis de frecuencias permitió agilizar la construcción del corpus terminológico final mediante la supresión de palabras vacías –léxico no especializado— o la eliminación de palabras muy poco frecuentes —en ocasiones, errores tipográficos, o bien palabras muy específicas con poca probabilidad de resultar de interés para el usuario del sitio web—. Asimismo, la lematización permitió relacionar cada lema con sus variantes morfológicas.

Tras este proceso se obtuvieron más de quinientos términos en lengua española a partir de los que se diseñó y creó la base de datos bilingüe (español–inglés) que incluye información básica de cada término (definición, categoría gramatical, categorías conceptuales, ilustración, entre otros datos). Además, se han incorporado las relaciones conceptuales entre los diversos términos y se les ha asignado la notación correspondiente a su campo temático según un sistema normalizado de clasificación ampliamente utilizado. Dada la riqueza léxica de nuestro objeto de estudio y las múltiples áreas temáticas implicadas, se han creado varios mapas conceptuales de acuerdo a diferentes campos, donde todos los términos analizados se encuentran relacionados entre sí de un modo u otro. La incorporación de una interfaz gráfica que permita la visualización de las jerarquías conceptuales y la navegación interactiva amigable convierten a este tipo de herramientas en un complemento imprescindible de los sitios web con información especializada.

La implementación de una herramienta terminológica multilingüe integrada en los sitios web con información sobre patrimonio facilitaría a los usuarios potenciales -e investigadores, , educadores, especialistas en patrimonio profesionales del turismo, visitantes, entre otros- el acceso a la información web incrementando por tanto la difusión y visibilidad de la misma.

Referencias

Alonso Almeida, Mar; Figueroa Domecq, Cristina; Rodríguez Antón, José Miguel; Talón Ballestero, Pilar (2008). ―El impacto de la tecnología social en las decisiones de consumo turístico‖. VII Congreso ―Turismo y Tecnologías de la Información y las Comunicaciones‖, Turitec 2008. Málaga, 25 al 26 de septiembre de 2008

O'Reilly, T. (2007) ―What Is Web 2.0: Design Patterns and Business Models for the Next Generation of Software‖. International Journal of Digital Economics. 65: 17- 37

Olvera-Lobo, M.D.; Gutiérrez-Artacho, J. (2012) ―Monumentos andaluces en la Web 2.0‖. III Congreso Internacional de Patrimonio y Expresión Gráfica Aplicada 2012. Granada, 21 al 23 de noviembre, 2012.

Olvera-Lobo, M.D.; Gutiérrez-Artacho, J. (2012) ―Visibilidad y presencia de los bienes inmuebles de Andalucía en la Web 2.0‖. X Congreso Internacional de Turismo y Tecnologías de la Información y las Comunicaciones. Málaga, 23 y 24 de octubre de 2014.