RESCATA | Representación Canónica y Transformaciones de los Textos Aplicado a las Tecnologías del Lenguaje Humano

Financiación

El proyecto RESCATA (Representación canónica y transformaciones de los textos aplicado a las Tecnologías del Lenguaje Humano) con referencia TIN2015-65100-R está parcialmente financiado por la Universidad de Alicante y el gobierno de España a través del Programa Estatal de I+D+i Orientada a los Retos de la Sociedad del Ministerio de Economía, Industria y Competitividad.

Statistical language modelling for automatic story generation

Enviado por imoreno el Mar, 06/19/2018 - 11:48

This paper proposes an end-to-end Natural Language Generation approach to automatically create fiction stories using statistical language models. The proposed approach integrates the stages of macroplanning and the surface realisation, necessary to determine the content to write about together with the structure of the story, and the syntactic and lexical realisation of sentences to be generated, respectively.

URL:

https://content.iospress.com/articles/journal-of-intelligent-and-fuzzy-systems/i…

Analysing Positional Language Models for Natural Language Generation

Enviado por imoreno el Mar, 06/19/2018 - 11:43

The structure and selection of content in Automatic Language Generation is commonly referred to as Macroplanning. It provides an intermediate artefact that conveys such information, called document plan. This paper studies the appropriateness of Positional Language Models for building that plan, since they provide mechanisms to outline relevant elements and their distribution along the text. A series of experiments were conducted over a corpus of children tales in English, with the purpose of studying the behaviour and optimal adjustment of the method and its parameters.

URL:

http://ltc.amu.edu.pl/book/papers/TAN-3.pdf

The challenging task of summary evaluation: an overview

Enviado por imoreno el Mar, 06/19/2018 - 11:29

Evaluation is crucial in the research and development of automatic summarization applications, in order to determine the appropriateness of a summary based on different criteria, such as the content it contains, and the way it is presented. To perform an adequate evaluation is of great relevance to ensure that automatic summaries can be useful for the context and/or application they are generated for.

URL:

https://doi.org/10.1007/s10579-017-9399-2

Leer más sobre The challenging task of summary evaluation: an overview
Inicie sesión para comentar

Planificación posicional en el diseño de sistemas versátiles de generación de lenguaje natural

Enviado por imoreno el Mar, 06/19/2018 - 11:25

La Generación de Lenguaje Natural es la disciplina que permite conferir cierta forma textual a un conjunto de datos, persiguiendo un determinado objetivo comunicativo. El actual escenario tecnológico reclama sistemas de generación flexibles, adaptables a diferentes casos de uso, por lo que la incorporación dinámica del contexto debe formar parte del sistema mismo. La propuesta que aquí se expone busca introducir información semántica y pragmática en la parte del proceso que selecciona y estructura los mensajes esperados en la salida.

URL:

http://ceur-ws.org/Vol-1961/paper11.pdf

Analizando opiniones en las redes sociales

Enviado por imoreno el Mar, 06/19/2018 - 11:22

La Web 2.0 ha focalizado la importancia de la información, no en unos pocos expertos en un tema, sino en una multitud de opiniones vertidas por usuarios a través de diversos medios en las redes sociales. Debido a ello, han cobrado un mayor interés los sistemas que son capaces de determinar qué es lo que piensan los usuarios sobre un determinado concepto, agregando diferentes fuentes de datos y aplicando cálculos de polaridad de las opiniones, que permiten determinar y comparar esos conceptos con otros similares.

URL:

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/viewFile/5423/3187

Leer más sobre Analizando opiniones en las redes sociales
Inicie sesión para comentar

On Evaluating the Contribution of Text Normalisation Techniques to Sentiment Analysis on Informal Web 2.0 Texts

Enviado por imoreno el Mar, 06/19/2018 - 11:18

The writing style used in social media usually contains informal elements that can lower the performance of Natural Language Processing applications. For this reason, text normalisation techniques have drawn a lot of attention recently when dealing with informal content. However, not all the texts present the same level of informality and may not require additional pre-processing steps.

URL:

http://dx.doi.org/10.26342/2017-58-5409

Opinion Mining in Social Networks versus Electoral Polls

Enviado por imoreno el Mar, 06/19/2018 - 11:15

The recent failures of traditional poll models, like the predictions in United Kingdom with the Brexit, or in United States presidential election with the victory of Donald Trump, have been noteworthy. With the decline of traditional poll models and the growth of the social networks, automatic tools are gaining popularity to make predictions in this context. In this paper we present our approximation and compare it with a real case: the 2017 French presidential election.

URL:

https://doi.org/10.26615/978-954-452-049-6_032

Leer más sobre Opinion Mining in Social Networks versus Electoral Polls
Inicie sesión para comentar

CARMEN: Sistema de entity typing basado en perfiles

Enviado por imoreno el Mar, 06/19/2018 - 11:10

Este poster presenta un sistema de entity typing, que emplea el algoritmo Random Forest de aprendizaje automático. Nuestro conjunto de características incluye información local de la propia entidad y perfiles, todo ello generado de manera no supervisada. El rendimiento del sistema en varias lenguas (Español, Holandés, Inglés y Chino Mandarín) y dominios (general y médico) demuestra la portabilidad y adecuación de esta aproximación independientemente del corpus.

Leer más sobre CARMEN: Sistema de entity typing basado en perfiles
Inicie sesión para comentar

Reconocimiento y clasificación de entidades nombradas independiente de la lengua y el dominio mediante perfiles

Enviado por imoreno el Mar, 06/19/2018 - 11:08

El reconocimiento y la clasificación de entidades nombradas (RCEN) es clave para muchas aplicaciones de procesamiento de lenguaje natural. Sin embargo, la adaptación de un sistema RCEN suele resultar costosa, ya que la mayoría solo funcionan adecuadamente en el escenario para el que fueron desarrollados. Por tanto, el objetivo principal de esta tesis es la investigación, análisis y desarrollo de un sistema adaptable, llamado CARMEN, para el RCEN mediante perfiles y aprendizaje automático supervisado.

URL:

http://ceur-ws.org/Vol-1961/paper07.pdf

Combining Profiles and Local Information for Named Entity Classification: Adjustment of a Domain and Language Independent Approach

Enviado por imoreno el Mar, 06/19/2018 - 10:55

This paper presents a named entity classification system, which employs Random Forest machine learning algorithm. Our feature set includes local entity information and profiles, all of which is generated in an unsupervised manner. Performance on various languages (Spanish, Dutch and English) and domains (general and medical) demonstrate the flexibility, portability and adequateness of our approach regardless of the corpus.

URL:

http://ltc.amu.edu.pl/book/papers/IRIE1-2.pdf

Representación Canónica

Flexiones

Necesidades del Usuario

Financiación

Statistical language modelling for automatic story generation

Analysing Positional Language Models for Natural Language Generation

The challenging task of summary evaluation: an overview

Planificación posicional en el diseño de sistemas versátiles de generación de lenguaje natural

Analizando opiniones en las redes sociales

On Evaluating the Contribution of Text Normalisation Techniques to Sentiment Analysis on Informal Web 2.0 Texts

Opinion Mining in Social Networks versus Electoral Polls

CARMEN: Sistema de entity typing basado en perfiles

Reconocimiento y clasificación de entidades nombradas independiente de la lengua y el dominio mediante perfiles

Combining Profiles and Local Information for Named Entity Classification: Adjustment of a Domain and Language Independent Approach

Páginas

Representación Canónica

Flexiones

Necesidades del Usuario

Financiación

Inicio de sesión

Páginas