Statistical language modelling for automatic story generation

This paper proposes an end-to-end Natural Language Generation approach to automatically create fiction stories using statistical language models. The proposed approach integrates the stages of macroplanning and the surface realisation, necessary to determine the content to write about together with the structure of the story, and the syntactic and lexical realisation of sentences to be generated, respectively.

Analysing Positional Language Models for Natural Language Generation

The structure and selection of content in Automatic Language Generation is commonly referred to as Macroplanning. It provides an intermediate artefact that conveys such information, called document plan. This paper studies the appropriateness of Positional Language Models for building that plan, since they provide mechanisms to outline relevant elements and their distribution along the text. A series of experiments were conducted over a corpus of children tales in English, with the purpose of studying the behaviour and optimal adjustment of the method and its parameters.

The challenging task of summary evaluation: an overview

Evaluation is crucial in the research and development of automatic summarization applications, in order to determine the appropriateness of a summary based on different criteria, such as the content it contains, and the way it is presented. To perform an adequate evaluation is of great relevance to ensure that automatic summaries can be useful for the context and/or application they are generated for.

Planificación posicional en el diseño de sistemas versátiles de generación de lenguaje natural

La Generación de Lenguaje Natural es la disciplina que permite conferir cierta forma textual a un conjunto de datos, persiguiendo un determinado objetivo comunicativo. El actual escenario tecnológico reclama sistemas de generación flexibles, adaptables a diferentes casos de uso, por lo que la incorporación dinámica del contexto debe formar parte del sistema mismo. La propuesta que aquí se expone busca introducir información semántica y pragmática en la parte del proceso que selecciona y estructura los mensajes esperados en la salida.

Analizando opiniones en las redes sociales

La Web 2.0 ha focalizado la importancia de la información, no en unos pocos expertos en un tema, sino en una multitud de opiniones vertidas por usuarios a través de diversos medios en las redes sociales. Debido a ello, han cobrado un mayor interés los sistemas que son capaces de determinar qué es lo que piensan los usuarios sobre un determinado concepto, agregando diferentes fuentes de datos y aplicando cálculos de polaridad de las opiniones, que permiten determinar y comparar esos conceptos con otros similares.

On Evaluating the Contribution of Text Normalisation Techniques to Sentiment Analysis on Informal Web 2.0 Texts

The writing style used in social media usually contains informal elements that can lower the performance of Natural Language Processing applications. For this reason, text normalisation techniques have drawn a lot of attention recently when dealing with informal content. However, not all the texts present the same level of informality and may not require additional pre-processing steps.

Opinion Mining in Social Networks versus Electoral Polls

The recent failures of traditional poll models, like the predictions in United Kingdom with the Brexit, or in United States presidential election with the victory of Donald Trump, have been noteworthy. With the decline of traditional poll models and the growth of the social networks, automatic tools are gaining popularity to make predictions in this context. In this paper we present our approximation and compare it with a real case: the 2017 French presidential election.

CARMEN: Sistema de entity typing basado en perfiles

Este poster presenta un sistema de entity typing, que emplea el algoritmo Random Forest de aprendizaje automático. Nuestro conjunto de características incluye información local de la propia entidad y perfiles, todo ello generado de manera no supervisada. El rendimiento del sistema en varias lenguas (Español, Holandés, Inglés y Chino Mandarín) y dominios (general y médico) demuestra la portabilidad y adecuación de esta aproximación independientemente del corpus.

Reconocimiento y clasificación de entidades nombradas independiente de la lengua y el dominio mediante perfiles

El reconocimiento y la clasificación de entidades nombradas (RCEN) es clave para muchas aplicaciones de procesamiento de lenguaje natural. Sin embargo, la adaptación de un sistema RCEN suele resultar costosa, ya que la mayoría solo funcionan adecuadamente en el escenario para el que fueron desarrollados. Por tanto, el objetivo principal de esta tesis es la investigación, análisis y desarrollo de un sistema adaptable, llamado CARMEN, para el RCEN mediante perfiles y aprendizaje automático supervisado.

Combining Profiles and Local Information for Named Entity Classification: Adjustment of a Domain and Language Independent Approach

This paper presents a named entity classification system, which employs Random Forest machine learning algorithm. Our feature set includes local entity information and profiles, all of which is generated in an unsupervised manner. Performance on various languages (Spanish, Dutch and English) and domains (general and medical) demonstrate the flexibility, portability and adequateness of our approach regardless of the corpus.

Páginas

Suscribirse a RESCATA RSS