Asesor Lingüístico automatizado en Internet (ASLI)

Francisco Javier Carreras Riudavets
francisco.carreras@ulpgc.es
Universidad de Las Palmas de Gran Canaria
Lydia Arroyo Herrero
arroyoherrero@yahoo.es
Jorge Bueno Godoy
jbueno-@hotmail.com
Lorena Rodríguez Hernández
orenarh@hotmail.com
Gustavo Rodríguez Rodríguez
grodrigu@dis.ulpgc.es
Universidad de Las Palmas de Gran Canaria

Comunicación breve
Procesamiento del lenguaje natural


ASLI es una herramienta esencial para la producción de textos escritos en español. Los servicios que ofrece ―corrección automática con sistemas de aprendizaje inteligente, guía didáctica o manual de uso de la lengua española y radiografía del texto en términos estadísticos―, conforman los pilares básicos de este asesor lingüístico automatizado.

Servirá como corrector automático de errores frecuentes de los niveles tipográfico, ortográfico, morfológico, gramatical y cuando lo precise, léxico y de estilo. Esta vertiente está pensada especialmente para el análisis de grandes producciones de texto que requieren una revisión y corrección prácticamente en tiempo real. Los usuarios potenciales de esta corrección automática pueden ser editoriales, órganos institucionales, ediciones digitales de medios de comunicación, blogs… es decir, usuarios de español que utilicen nuestra lengua como vehículo de expresión.

ASLI pretende ser una guía didáctica de la lengua que aporte información gramatical, ejemplos de uso y referencias bibliográficas normativas en los casos que entrañen dificultad para los usuarios del español, tanto nativos (más de 500 millones de hablantes) como aprendientes, profesionales (traductores y profesores) y curiosos que pretenden conocer los entresijos de nuestra lengua.

ASLI sirve como herramienta de radiografía estructural y análisis para la extracción de datos estadísticos relacionados con la métrica, la morfología y el léxico de un texto. Esto permitirá mediante la comparación con datos obtenidos de obras de renombre comparar la calidad estructural del texto.

Tanto la tarea de corrección como la de asesoría se basan en la normativa RAE más reciente. El pilar fundamental de la gramática que surte a ambos servicios es la Nueva Gramática de la Lengua Española (2010) que da cobertura a todos los fenómenos que se desarrollan en nuestra lengua. También se hará uso, para cuestiones puntuales, del Diccionario panhispánico de dudas (2005).

Para los niveles más específicos como la ortografía o la tipografía, se acude por un lado, a la Ortografía publicada por la RAE (2010), y por otro, a las indicaciones del experto en estas cuestiones J. Martínez de Sousa, Ortografía y ortotipografía del español actual (2008).

A medida que los diccionarios van recogiendo nuevas voces y la norma va geenrando nuevas directrices gramaticales, ASLI también avanza, recopilando e implementando esta información para garantizar una corrección y servicio de asesoría actualizado y de acuerdo con la norma.

Su sistema de aprendizaje garantiza una continua evolución y perfeccionamiento de la herramienta reduciendo el margen de errores en textos futuros. La participación directa del usuario mediante la selección de opciones correctas ayudará de manera estadística a mejorar sus resultados. Cuanto más se use ASLI, mejores serán sus resultados.

ASLI, a diferencia de los otros correctores disponibles, se concibe como una aplicación que trasciende la clásica corrección automática. Pretende ser una herramienta en internet que ofrezca cobertura a páginas web y dominios de internet de corrección y asesoramiento lingüístico en diferido. El Asesor ASLI, a diferencia de los correctores de texto tradicionales, además de trabajar con texto que aportará el usuario, también permitirá analizar el contenido de una dirección web (un artículo de un periódico, un blog, una página informativa de la Administración), o bien, un dominio completo (www.wikipedia.es, www.elmundo.es). Al finalizar el análisis se enviará al interesado un informe detallado del resultado por correo electrónico. Los propietarios de los dominios podrán seleccionar la frecuencia de análisis de sus webs y despreocuparse hasta la llegada del informe ASLI.

Se trata de una herramienta flexible y en continuo desarrollo que, en sus fases más avanzadas, permitirá, bien ser configurada ad hoc por el usuario según sea su perfil e intereses ―hablante nativo, aprendiz de español, estudiante nativo de lengua española, profesional de la lengua (traductores y correctores), usuarios de español americano, textos en registro formal o coloquial...―, bien elegir entre varios perfiles/plantillas predefinidas que se ajusten a sus necesidades. Estos últimos habrán sido diseñados y desarrollados previamente por el equipo de investigación. De este modo, el usuario podrá seleccionar el tipo de corrección y recomendaciones que desee recibir así como los niveles lingüísticos que quiere que sean analizados en su texto, además de tener acceso al análisis estructural integral de la edición en todo momento, en forma de datos estadísticos.

La utilidad de ASLI no se limita a la corrección; pretende ser una herramienta de análisis estadístico textual e información lingüística razonada y documentada que aporte contenidos útiles y actualizados al usuario para la tarea de la elaboración o revisión de un texto. El asesor observará todas las variedades del español panhispánico, y bajo el criterio establecido por la norma académica (RAE), ofrecerá al usuario indicaciones en los casos en los que el programa detecte en el texto la presencia de un error o de una palabra o secuencia de palabras que supongan dificultad para el escritor o sean un error frecuente reconocido y tratado por la bibliografía específica.

Las indicaciones que se propongan al escritor ―notas lingüísticas―, que conforman el servicio de asesoría lingüística, parten del escrutinio de varios niveles de la lengua; ortográfico, tipográfico, léxico, morfológico, morfoléxico, semántico y gramatical. Estas notas de carácter didáctico serán clasificadas inicialmente ―en la aplicación para el usuario― en tres grandes bloques de incidencias:

  1. Errores
  2. Recomendaciones
  3. Avisos lingüísticos

En el primer caso, la aplicación dará la opción de corregir automáticamente los errores detectados, y ofrecerá, si se solicita, una explicación didáctica o norma generalizada que argumente la corrección. Las recomendaciones por su parte, no surgirán de los errores, sino de los casos en los que la lengua provea varias opciones correctas. Serán, por tanto, sugerencias y alternativas que se aporten al escritor para que él mismo, prestando atención al contexto, intención comunicativa y registro del texto, tome la decisión que considere más apropiada.

Se tendrán en cuenta las variedades panhispánicas del español para recomendar la mejor opción en función de la ubicación seleccionada por el usuario para el texto analizado. Por otro lado, el sistema de aprendizaje del propio programa intervendrá en la oferta de opciones para el usuario. En el tercer caso, los avisos lingüísticos, el usuario será advertido de la posibilidad, en ciertas circunstancias, de haber cometido un error. Para la detección de este tipo de fenómenos, en la mayoría de los casos relacionados con la interpretación semántica o el análisis sintáctico de alto nivel (adjunción de papeles temáticos, rección verbal con restricciones semánticas…), es necesaria la intervención ―no automática― de un humano capaz de dar sentido e interpretar de modo activo un texto. En este caso, también serán consideradas las aportaciones geolingüísticas de la norma para mayor precisión en los avisos.

Se indicará el nivel lingüístico o área afectada por la incidencia encontrada, esto es, el tipo de corrección (u observación, en su caso) que el escritor quiera recibir. Inicialmente, se considerarán los siguientes niveles de corrección:

En los casos en los que sea posible, e independientemente de la tipología de incidencia encontrada en el texto (error, recomendación o aviso), se aportarán generalizaciones lingüísticas, reglas gramaticales y ejemplos que sirvan de apoyo y guía para futuros escritos.