Descripción

En el contexto de la Sociedad Digital, la sobreabundancia de información y la heterogeneidad de la misma exigen nuevos modos de acceder, procesar y generar conocimiento atendiendo a las necesidades de los usuarios. En este sentido, las Tecnologías del Lenguaje Humano (TLH) juegan un papel clave en el análisis, procesamiento y comprensión de la información. Sin embargo, los avances realizados en las diversas aplicaciones de TLH resuelven tareas concretas en dominios determinados, ofreciendo soluciones desde un perspectiva parcial y aislada, sin mantener un modelo común para la extracción de conocimiento y sin considerar las necesidades de usuario como aspecto transversal e intrínseco en el proceso.

Por ello, el objetivo principal del proyecto RESCATA (Representación canónica y transformaciones de los textos aplicado a las Tecnologías del Lenguaje Humano, Ref. TIN2015-65100-R) se basa en la necesidad de investigar en un nuevo paradigma para la comprensión del texto que nos permita determinar una representación estándar, única, invariable e independiente, denominada representación canónica, a partir de la cual, y mediante un proceso de transformación, obtener diferentes tipos de flexiones adecuadas a las necesidades de cada usuario para poder ser aplicadas a otras tareas de TLH, como la de simplificar, enriquecer o resumir.

Para lograr este objetivo se definen los siguientes objetivos concretos:

  • (OBJ1) Definir qué es la representación canónica de los textos, identificando la información necesaria para la obtención de dicha representación y desarrollando una estructura de servicios que garantice que tal representación es una forma estándar, única e invariable del conocimiento contenido en dichos textos.
    Investigador responsable: IP1 - Paloma Moreda Pozo
  • (OBJ2) Definir qué son las flexiones de los textos, identificando la información necesaria para la generación de dichas flexiones y desarrollando una estructura de servicios que permita la obtención de tales variaciones.
    Investigador responsable: IP1 - Paloma Moreda Pozo
  • (OBJ3) Crear, recopilar y adaptar recursos, técnicas y herramientas de TLH para comprensión e integrarlas en el modelo estructural canónico.
    Investigadores responsables: IP1 - Paloma Moreda Pozo e IP2 - Armando Suárez Cueto
  • (OBJ4) Identificar las necesidades de los usuarios y su relación con las diferentes flexiones que se pueden generar a partir de la representación canónica de los textos.
    Investigadores responsables: IP1 - Paloma Moreda Pozo e IP2 - Armando Suárez Cueto
  • (OBJ5) Crear un marco de evaluación para el modelo basado en la combinación y la unificación de métricas intrínsecas a los componentes del modelo, así como desarrollar un escenario de uso que muestre la validez del mismo.
    Investigador responsable: IP2 - Armando Suárez Cueto
  • (OBJ6) Promocionar y difundir las líneas de investigación del proyecto mediante la participación y organización de actividades en campañas, congresos, talleres, seminarios y redes temáticas, así como la posible transferencia tecnológica a la sociedad.
    Investigadores responsables: IP1 - Paloma Moreda Pozo e IP2 - Armando Suárez Cueto

Para demostrar la validez de nuestra propuesta, se realizará una evaluación intrínseca cuyo objetivo será el análisis y definición de métricas cualitativas y cuantitativas que evalúen la representación canónica y sus flexiones de manera independiente. Además se propone  una evaluación extrínseca a través de un escenario en el contexto de la educación en línea sobre el cual se aplicará el modelo definido para determinar su robustez y fiabilidad.

Los resultados del proyecto (publicaciones, recursos, registros de software, etc.) contribuirán significativamente a las prioridades temáticas del reto de Economía y Sociedad Digital. A nivel científico, se avanzará en la frontera del conocimiento en el área de TLH; a nivel social, se asegurará la accesibilidad y asequibilidad de la información a cualquier usuario; y a nivel económico, el conocimiento y los desarrollos obtenidos serán transferido a la sociedad.