TUSIR

El objetivo general de este proyecto consiste en el desarrollo de técnicas de análisis de textos para su incorporación en sistemas de procesamiento de lenguaje natural aplicables a la resolución de problemas de recuperación de la información.

Un sistema de estas características debe tomar como entrada frases de consulta a un sistema de información documental, escritas en lenguaje natural sin otras restricciones que las que marca la propia aplicación y debe proporcionar como salida la relación de documentos con información relevante sobre la consulta solicitada. Para llevar a cabo este proceso global fijamos los siguientes objetivos concretos del proyecto:

  1. Desarrollo de técnicas de análisis de la frase de entrada y de extracción de los conceptos significativos de la misma.
  2. Desarrollo de técnicas de análisis y extracción de los conceptos significativos de los documentos almacenados.
  3. Diseño de una estructura semántica adecuada para la representación de los conceptos significativos de los documentos almacenados.
  4. Desarrollo de estrategias de búsqueda conceptual en la estructura semántica, compatibles con el significado de la consulta realizada.

Como objetivos tecnológicos se plantean los siguientes:

  • Construcción de una plataforma de integración de todas las herramientas desarrolladas, mediante un entorno gráfico, para facilitar las tareas de construcción y validación de corpus etiquetados.
  • Obtención de un corpus en español etiquetado léxica, sintáctica, y semánticamente, y con las cadenas de correferencias resueltas.

Como objetivos científicos se plantean los siguientes:

  • Utilización de técnicas de aprendizaje a partir de datos, y en particular, de inferencia gramatical para la definición de modelos de lenguaje.
  • Desarrollo de analizadores sintácticos parciales utilizando aproximaciones basadas en reglas y en modelos estadísticos.
  • Desarrollo de nuevos métodos de resolución de la correferencia lingüística.
  • Desarrollo de estrategias de comprensión de texto.
  • Desarrollo de técnicas de desambiguación del significado de las palabras utilizando información extraída de WordNet Español y WordNet Inglés.
  • Estudio de la aplicabilidad de las técnicas desarrolladas a la recuperación de información información.
Página oficial: 
http://gplsi.dlsi.ua.es/TUSIR/
Líneas de investigación: 
Responable: 

Últimas noticias

Noticias científicas