ATTOS: Análisis de Tendencias y Temáticas a través de Opiniones y Sentimientos

El proyecto ATTOS http://junior.dlsi.ua.es:8104/attos/ centra su actividad en el estudio y desarrollo de técnicas de análisis de opiniones, enfocado a proporcionar toda la información necesaria para que una empresa o una institución pueda tomar decisiones estratégicas en función a la imagen que la sociedad tiene sobre esa empresa, producto o servicio. El objetivo último del proyecto es la interpretación automática de estas opiniones, posibilitando así su posterior explotación. Para ello se estudian parámetros tales como la intensidad de la opinión, ubicación geográfica y perfil de usuario, entre otros factores, para facilitar la toma de decisiones.

A las dificultades intrínsecas de las tareas tratadas tradicionalmente por las Tecnologías del Lenguaje Humano (TLH) hay que añadir ahora la aparición de nuevos registros de uso en la lengua escrita que se caracterizan por su proximidad a la lengua oral y, por tanto, requieren de nuevos modelos de lenguaje. Los motores de búsqueda actuales deben hacer frente a una problemática cada vez más compleja, de la que destacamos sólo algunos de sus aspectos más relevantes: (a) la relajación de la norma y la presencia de formas de lenguaje coloquiales con predominio de la subjetividad; (b) la mayor presencia de información no estática, de ahí la importancia de la información temporal ya que no sólo es necesario saber cuándo se genera la información sino también a qué referente temporal se alude; (c) la necesidad de resumir o compilar datos de múltiples fuentes, formatos y lugares, con el consiguiente cruce de culturas y lenguas; (d) la búsqueda en dominios especializados; (e) la necesidad de contrastar la información y captar la opinión y (f) la verificación de autoría.

Las actuales herramientas para las TLH no son directamente aplicables a estos nuevos usos y medios de comunicación o son, simplemente, inadecuadas. Hasta el momento actual, una de las principales premisas de tales herramientas es la total formalidad en el lenguaje y una cierta rigidez en las condiciones de entrada y salida de datos. Sin embargo, este nuevo escenario hace imprescindible adaptar e incluso replantear el conjunto de recursos y herramientas. Se busca explotar de forma inteligente la ingente cantidad de información publicada y obtener un valor añadido que permita procesarla eficientemente para convertirla en conocimiento (Witte & Gitzinger, 2007).