Estilística del género literario asistida por ordenador (Universidad de Würzburg, Alemania)

José Calvo Tello
jose.calvo@morethanbooks.eu
Ulrike Henny
ulrike.henny@uni-wuerzburg.de
Universität Würzburg

Poster
Estilística y estilometría


El objetivo general del grupo (CLiGS por sus siglas en alemán, clgs.hypotheses.org) es aplicar métodos recientes de análisis cuantitativo de textos para tratar problemas básicos de los estudios literarios (Moretti 2005, Ramsay 2011, Jockers 2013). En concreto analizamos la relación entre el estilo y el género literario, para lo cual utilizamos extensos corpus de obras literarias en español y francés. Con el póster queremos dar a conocer nuestros proyectos y buscar posibles socios y cooperaciones. 

Estilo y género literario

El proyecto busca rasgos estilísticos que permitan definir géneros ( Biber 1992; Kessler 1997). ¿Qué comparte un género literario y sus subgéneros? ¿Qué aspecto diferencian subgéneros emparentados? Los géneros literarios se entienden como categorías textuales complejas que la crítica ha definido según diferentes tipos de criterios:

  1. Unidades lingüísticas: léxicas, morfológicas, sintácticas o textuales
  2. Unidades literarias como los temas tratados o los personajes y sus relaciones Podremos verificar o falsear estas teorías realizando pruebas empíricas sobre los corpus textuales.

Metodologías

La primera fase del proyecto prevé conseguir los textos en formato XML-TEI sencillo; posteriormente se realizará anotación lingüística sobre ellos. Una vez estén anotados, aplicaremos diferentes métodos de análisis:

Proyectos concretos

El grupo engloba seis proyectos de humanidades e informática: cuatro tesis doctorales y dos trabajos postdoctorales. En la conferencia detallaremos principalmente los proyectos que trabajan con textos en español. Los otros tres proyectos investigan textos en francés y llevan por título:

Subgéneros de la novela argentina y mexicana, 1850-1920

A mitad del siglo XIX, la novela latinoamericana toma forma a través de la publicación de numerosos textos. El proyecto se centra en aproximadamente 150 textos de Argentina y México. Usando un enfoque temático, el trabajo investigará cuáles son los subgéneros dominantes en este período y como se dejan definir en términos de estilo, asumiendo que se trata de formas complejas que pueden ser descritas en varios niveles. Se analizarán subgéneros novelescos que transcienden corrientes literarias singulares, como la novela histórica, la novela social, la novela sentimental y la novela psicológica.

Análisis de los subgéneros de prosa en España, 1880-1939

Durante la llamada Edad de Plata española tiene lugar un cambio estilístico que afecta también los géneros y subgéneros literarios. Aparecen numerosas obras en prosa que son catalogadas bajo decenas de conceptos: nivola, ficción-ensayo, novela lírica, novela intelectual y un largo etcétera. El corpus recogerá alrededor de 200 textos en prosa con especial foco en la Generación del 98, junto a autores tanto anteriores como posteriores. El trabajo realizará una revisión sobre las teorías sobre estos subgéneros enfrentándolas a pruebas empíricas, y espera proponer nuevas categorizaciones.

Estilística de subgéneros del teatro español y francés, 1580-1780

Este proyecto comparará la estructura estilística del género del teatro francés y español. Son de esperar grandes diferencias entre el teatro español del Siglo de Oro y el "théâtre classique" francés. Cada lengua estará representada por aproximadamente 800 piezas. El primer objetivo será establecer, en una perspectiva descriptiva, una amplia descripción estilística, con especial atención a las correlaciones de los diferentes niveles de descripción. Después, la investigación focalizará los fenómenos de diferenciación sincrónica y diacrónica en las dos colecciones de textos. Finalmente el proyecto reconsiderará los fundamentos conceptuales de la teoría y de la historia de los géneros sobre la base de los resultados cuantitativos.

Universidad y colaboradores

El líder del proyecto es Christof Schöch, está financiado por el Ministerio de Educación e Investigación alemán (www.bmbf.de) y se ubica en la cátedra de "Filología computacional" de la Universidad de Würzburg (Alemania). Esta Universidad investiga desde hace varias décadas mediantes herramientas informáticas aspectos literarios y textuales. La facultad ofrece estudios sobre Humanidades Digitales, forma parte de Dariah y alberga otros proyectos del área. El grupo colabora formalmente con diferentes grupos y Universidades de Alemania, Francia, Polonia y Bélgica.

Bibliografía

Alpaydin, Ethem. 2010. Introduction to Machine Learning. 2nd ed. Cambridge, Mass: MIT Press.

Blei, David M. 2011. “Introduction to Probabilistic Topic Models.” Communication of the ACM.

Biber, Douglas. 1992. “The Multidimensional Approach to Linguistic Analyses of Genre Variation: An Overview of Methodology and Finding.” Computers in the Humanities 26 (5-6): 331 –47.

Kessler, Brett, Geoffrey Numberg, and Hinrich Schütze. 1997. “Automatic Detection of Text Genre.” In Proceedings of the 35th Annual Meeting of the ACL, 32–38. Stroudsburg, PA, USA: Association for Computational Linguistics.

Jockers, Matthew L. 2013. Macroanalysis: Digital Methods and Literary History. Topics in the Digital Humanities. University of Illinois Press.

Manning, Christopher D., and Hinrich Schütze. 1999. Foundations of Statistical Natural Language Processing. Cambridge, Mass: The MIT Press.

Moretti, Franco. 2005. Graphs, Maps, Trees: Abstract Models for a Literary History. Verso.

Newman, M. E. J. 2010. Networks: An Introduction. Oxford; New York: Oxford University Press.

Oakes, Michael P. 1998. Statistics for Corpus Linguistics. Edinburgh Textbooks in Empirical Linguistics. Edinburgh: Edinburgh University Press.

Pustejovsky, James, and Amber Stubbs. 2013. Natural Language Annotation for Machine Learning. Sebastopol: O’Reilly.

Ramsay, Stephen. 2011. Reading Machines : Toward an Algorithmic Criticism. Urbana Ill.: University of Illinois Press.