Publicaciones

Estudio de un enfoque híbrido para la Generación del Lenguaje Natural

Este proyecto de tesis plantea una aproximación híbrida para la generación del lenguaje natural, la cual permitirá mejorar la calidad del texto producido, favoreciendo la independencia del dominio, del género textual y de la aplicación final donde se utilice. Con el fin de lograr este objetivo, se ha implementado un enfoque flexible de generación centrado en la fase de realización, el cual, apoyándose en conocimientos estadísticos y en lexicones, permite generar textos para diferentes dominios e idiomas guiados por la entrada.

Analysing the influence of semantic knowledge in natural language generation

This paper conducts an evaluation of several traditional Language Models for the task of Natural Language Generation, focusing on the surface realisation stage. Specifically, we analyse and compare the n-gram language models and the factored language models through the evaluation of automatically generated sentences. In this manner, factored language models have shown to be better, improving the coherence of the generated sentences compared with the ones generated with n-grams.

Statistical language modelling for automatic story generation

This paper proposes an end-to-end Natural Language Generation approach to automatically create fiction stories using statistical language models. The proposed approach integrates the stages of macroplanning and the surface realisation, necessary to determine the content to write about together with the structure of the story, and the syntactic and lexical realisation of sentences to be generated, respectively.

Analysing Positional Language Models for Natural Language Generation

The structure and selection of content in Automatic Language Generation is commonly referred to as Macroplanning. It provides an intermediate artefact that conveys such information, called document plan. This paper studies the appropriateness of Positional Language Models for building that plan, since they provide mechanisms to outline relevant elements and their distribution along the text. A series of experiments were conducted over a corpus of children tales in English, with the purpose of studying the behaviour and optimal adjustment of the method and its parameters.

The challenging task of summary evaluation: an overview

Evaluation is crucial in the research and development of automatic summarization applications, in order to determine the appropriateness of a summary based on different criteria, such as the content it contains, and the way it is presented. To perform an adequate evaluation is of great relevance to ensure that automatic summaries can be useful for the context and/or application they are generated for.

Planificación posicional en el diseño de sistemas versátiles de generación de lenguaje natural

La Generación de Lenguaje Natural es la disciplina que permite conferir cierta forma textual a un conjunto de datos, persiguiendo un determinado objetivo comunicativo. El actual escenario tecnológico reclama sistemas de generación flexibles, adaptables a diferentes casos de uso, por lo que la incorporación dinámica del contexto debe formar parte del sistema mismo. La propuesta que aquí se expone busca introducir información semántica y pragmática en la parte del proceso que selecciona y estructura los mensajes esperados en la salida.

Analizando opiniones en las redes sociales

La Web 2.0 ha focalizado la importancia de la información, no en unos pocos expertos en un tema, sino en una multitud de opiniones vertidas por usuarios a través de diversos medios en las redes sociales. Debido a ello, han cobrado un mayor interés los sistemas que son capaces de determinar qué es lo que piensan los usuarios sobre un determinado concepto, agregando diferentes fuentes de datos y aplicando cálculos de polaridad de las opiniones, que permiten determinar y comparar esos conceptos con otros similares.

On Evaluating the Contribution of Text Normalisation Techniques to Sentiment Analysis on Informal Web 2.0 Texts

The writing style used in social media usually contains informal elements that can lower the performance of Natural Language Processing applications. For this reason, text normalisation techniques have drawn a lot of attention recently when dealing with informal content. However, not all the texts present the same level of informality and may not require additional pre-processing steps.

Opinion Mining in Social Networks versus Electoral Polls

The recent failures of traditional poll models, like the predictions in United Kingdom with the Brexit, or in United States presidential election with the victory of Donald Trump, have been noteworthy. With the decline of traditional poll models and the growth of the social networks, automatic tools are gaining popularity to make predictions in this context. In this paper we present our approximation and compare it with a real case: the 2017 French presidential election.

CARMEN: Sistema de entity typing basado en perfiles

Este poster presenta un sistema de entity typing, que emplea el algoritmo Random Forest de aprendizaje automático. Nuestro conjunto de características incluye información local de la propia entidad y perfiles, todo ello generado de manera no supervisada. El rendimiento del sistema en varias lenguas (Español, Holandés, Inglés y Chino Mandarín) y dominios (general y médico) demuestra la portabilidad y adecuación de esta aproximación independientemente del corpus.

Páginas

Suscribirse a Publicaciones