Financiación

El proyecto RESCATA (Representación canónica y transformaciones de los textos aplicado a las Tecnologías del Lenguaje Humano) con referencia TIN2015-65100-R está parcialmente financiado por la Universidad de Alicante y el gobierno de España a través del Programa Estatal de I+D+i Orientada a los Retos de la Sociedad del Ministerio de Economía, Industria y Competitividad.

De Oraciones a Documentos: extendiendo Abstract Meaning Representation para la comprensión de textos

Enviado por imoreno el Lun, 06/18/2018 - 08:51

La sobreabundancia de información y su heterogeneidad requieren nuevas formas de acceder, procesar y generar conocimiento de acuerdo con las necesidades del usuario. Por ello, definir un formalismo adecuado para representar la información textual capaz de permitir a los ordenadores comprender y generar el lenguaje, es crucial para lograr esta tarea. Abstract Meaning Representation (AMR) es una representación del conocimiento estándar que puede capturar la información codificada en una oración en varios niveles lingüísticos. Sin embargo, su alcance se limita a una sola oración, y no se beneficia de la información semántica adicional que podrá ayudar a la generación de diferentes tipos de textos. En este artículo propondremos un método que amplia la información proporcionada por AMR y la utiliza para representar documentos completos. En base a nuestra propuesta, definiremos una representación de texto estándar única, invariable e independiente, llamada representación canónica. A partir de la cual, y mediante un proceso de transformación, obtendremos diferentes variantes de texto que serán apropiadas para las necesidades de los usuarios.

Autores:

Moreda, Paloma

Suárez, Armando

Lloret, Elena

Saquete, Estela

Moreno, Isabel

Tipo de publicación:

Artículo de revista

Nombre de la revista:

Procesamiento del Lenguaje Natural

Nombre del libro:

Volumen: