De Oraciones a Documentos: extendiendo Abstract Meaning Representation para la comprensión de textos

La sobreabundancia de información y su heterogeneidad requieren nuevas formas de acceder, procesar y generar conocimiento de acuerdo con las necesidades del usuario. Por ello, definir un formalismo adecuado para representar la información textual capaz de permitir a los ordenadores comprender y generar el lenguaje, es crucial para lograr esta tarea. Abstract Meaning Representation (AMR) es una representación del conocimiento estándar que puede capturar la información codificada en una oración en varios niveles lingüísticos. Sin embargo, su alcance se limita a una sola oración, y no se beneficia de la información semántica adicional que podrá ayudar a la generación de diferentes tipos de textos. En este artículo propondremos un método que amplia la información proporcionada por AMR y la utiliza para representar documentos completos. En base a nuestra propuesta, definiremos una representación de texto estándar única, invariable e independiente, llamada representación canónica. A partir de la cual, y mediante un proceso de transformación, obtendremos diferentes variantes de texto que serán apropiadas para las necesidades de los usuarios.

Autores: 
Moreda, Paloma
Suárez, Armando
Lloret, Elena
Saquete, Estela
Moreno, Isabel
Tipo de publicación: 
Artículo de revista
Nombre de la revista: 
Procesamiento del Lenguaje Natural
Nombre del libro: 
-
Volumen: 
60
Revisión por pares: 
Internacional: 
Editorial: 
Sociedad Española para el Procesamiento del Lenguaje Natural
Publicable: 
Año de publicación: 
2 018