Capa de Comprensión del Lenguaje Humano (CLH)

De acuerdo con los objetivos del proyecto, los procesos de comprensión del lenguaje humano (CLH) se plantean como la fuente de conocimiento que dotará a los procesos de generación del lenguaje (GLH) del contenido necesario para la producción del lenguaje. En esta capa se analizarán, recopilarán, adaptarán e integrarán todos los recursos, técnicas y herramientas necesarias para transformar la información obtenida desde diferentes fuentes en conocimiento útil que posteriormente se almacenará en las unidades básicas de conocimiento (que llamaremos L-Bricks).

Responsable de actividad: Mayte Roma

Las diferentes herramientas necesarias para la construcción de L-Bricks requieren de recursos que les proporcionen la información necesaria para su correcto funcionamiento. Esta información lingüística puede ser variada, desde estructuras léxicas hasta unidades y rasgos semánticos y/o pragmáticos.

Podemos dividir estos recursos en dos tipos: recursos sistémicos, que representan las lenguas como sistema abstracto de signos (diccionarios, léxicos y ontologías) y recursos contextuales, que representan las lenguas en su contexto de uso concreto (corpus lingüísticos). Todos ellos aglutinan la información necesaria sobre el dominio de trabajo.

Responsable de actividad: David Tomás

El tratamiento de la información y la construcción de herramientas necesarias para la elaboración de los L-Bricks se abordarán principalmente desde la perspectiva del aprendizaje automático. Desde esta perspectiva, son los propios algoritmos empleados en nuestras herramientas los responsables de aprender y mejorar su funcionamiento basándose en recursos textuales. El esfuerzo de los expertos se centra en este caso en la selección de los mejores algoritmos y características de aprendizaje a partir de los corpus y recursos recopilados. Esta aproximación dotará a nuestro sistema de la flexibilidad necesaria para poder adaptarse a diferentes lenguajes y dominios de aplicación. No obstante, se estudiará el uso de otras técnicas heurísticas complementarias basadas en conocimiento.

Responsable de actividad: Estela Saquete

Esta actividad se centrará en el desarrollo de las herramientas necesarias para construir y dotar de contenido a los L-Bricks. Dependiendo de la aplicación que queramos darle a nuestros componentes básicos, necesitaremos de diferentes herramientas que permitan detectar y enriquecer la información que almacenaremos.

Los retos principales del proyecto se centran en la capa semántica del lenguaje, por lo que serán necesarias herramientas que trabajan en este nivel. Entre las herramientas más significativas están aquellas que afrontan la desambiguación del sentido de las palabras, la detección de roles semánticos, el tratamiento de la implicación textual, la detección de entidades nombradas, la detección de información temporal y espacial, el análisis de sentimientos y la extracción de información.