RESCATA | Representación Canónica y Transformaciones de los Textos Aplicado a las Tecnologías del Lenguaje Humano

Financiación

El proyecto RESCATA (Representación canónica y transformaciones de los textos aplicado a las Tecnologías del Lenguaje Humano) con referencia TIN2015-65100-R está parcialmente financiado por la Universidad de Alicante y el gobierno de España a través del Programa Estatal de I+D+i Orientada a los Retos de la Sociedad del Ministerio de Economía, Industria y Competitividad.

Using the Twitter social network as a predictor in the political decision

Enviado por imoreno el Mar, 06/19/2018 - 10:51

The use of social networks as a predictive tool to predict the outcome of an election can generate controversy; however if you have a methodology that tries to equate the extracted data as if they were obtained through a conventional survey, that is to say using weighting factors more than what usually should be done, polarity and relevance of each tweet, can make it a very reliable technique in light of the results obtained; the proposed methodology was applied in the presidential election of Ecuador on February 19th, 2017.

URL:

http://rua.ua.es/dspace/handle/10045/76464

A Computational Method for Enabling Teaching-Learning Process in Huge Online Courses and Communities

Enviado por imoreno el Lun, 06/18/2018 - 08:45

Massive Open Online Courses and e-learning represent the future of the teaching-learning processes through the development of Information and Communication Technologies. They are the response to the new education needs of society. However, this future also presents many challenges such as the processing of online forums when a huge number of messages are generated. These forums provide an excellent platform for learning and connecting students of the subject, but the difficulties in following and searching the vast volume of information that they generate may produce the opposite effect.

URL:

http://dx.doi.org/10.19173/irrodl.v18i1.2637

Cross-Document Event Ordering through Temporal Relation Inference and Distributional Semantic Models

Enviado por imoreno el Lun, 06/18/2018 - 08:37

This paper focuses on the contribution of temporal relations inference and distributional semantic models to the event ordering task. Our system automatically builds ordered timelines of events from different written texts in English by performing first temporal clustering and then semantic clustering. In order to determine temporal compatibility, an inference from the temporal relationships between events –automatically extracted from a Temporal Information Processing system– is applied.

URL:

http://dx.doi.org/10.26342/2017-58-5413

DrugSemantics: A corpus for Named Entity Recognition in Spanish Summaries of Product Characteristics

Enviado por imoreno el Lun, 06/18/2018 - 08:32

For the healthcare sector, it is critical to exploit the vast amount of textual health-related information. Nevertheless, healthcare providers have difficulties to benefit from such quantity of data during pharmacotherapeutic care. The problem is that such information is stored in different sources and their consultation time is limited.

URL:

https://doi.org/10.1016/j.jbi.2017.06.013

A Multilingual Multi-domain Data-to-Text Natural Language Generation Approach

Enviado por imoreno el Lun, 06/18/2018 - 08:27

La investigación en enfoques multidominio innovadores y flexibles puede ser un paso significativo en el área de Generación del Lenguaje Natural. En este sentido, el objetivo de este artículo es presentar un enfoque estadístico centrado en la fase de realización. Este enfoque permite la generación de oraciones que cumplan un propósito dado por una “característica semilla” de entrada, la cual se encargará de guiar el proceso de generación.

URL:

http://dx.doi.org/10.26342/2017-58-5411

Propuesta y desarrollo de una aproximación de generación de resúmenes abstractivos multigénero

Enviado por imoreno el Lun, 06/18/2018 - 08:22

En este trabajo se propone el análisis de técnicas adecuadas para el dise˜no y desarrollo de un enfoque de generación de resúmenes multigénero, tomando como partida distintas fuentes de datos pertenecientes a distintos géneros textuales. El objetivo principal es combinar todos estos géneros y producir un resumen abstractivo, es decir un nuevo texto coherente que capte las ideas fundamentales sobre un tema recogidas en las fuentes de datos originales.

URL:

http://dx.doi.org/10.26342/2017-58-5412

Propuesta de un sistema de clasificación de entidades basado en perfiles e independiente del dominio

Enviado por imoreno el Vie, 06/15/2018 - 17:57

El reconocimiento y la clasificación de entidades nombradas (RCEN) es clave para muchas aplicaciones de procesamiento de lenguaje natural. Sin embargo, la adaptación de un sistema RCEN resulta costosa, ya que la mayoría solo funcionan adecuadamente en el dominio para el que fueron desarrollados. Considerando esta premisa, se evalúa si un sistema de clasificación de entidades nombradas basado en perfiles y aprendizaje automático obtiene los mismos resultados independientemente del dominio del corpus de entrenamiento.

URL:

http://hdl.handle.net/10045/69090

Diseño, compilación y anotación de un corpus para la detección de mensajes suicidas en redes sociales

Enviado por imoreno el Vie, 06/15/2018 - 17:53

Con el fin de desarrollar un sistema de prevención del suicidio en la red, se ha compilado y anotado un corpus piloto de mensajes de ideación suicida extraídos de las redes sociales. Los textos se han obtenido tanto de la Web como de la Deep Web, y se han seleccionado textos escritos tanto en español como en inglés. Para caracterizar semánticamente cada mensaje, éstos han sido anotados según su relación con el fenómeno suicida (pro-suicida, instigador, anti-suicidio, etc.).

URL:

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5494

TravelSum: A Spanish Summarization Application focused on the Tourism Sector

Enviado por imoreno el Vie, 06/15/2018 - 17:50

This demo showcases a Web application that allows users to easily obtain a summary that is automatically generated taking into account the information provided by other users on the Internet. The application integrates several types of summaries, outlining the most relevant positive opinions, negative and both about restaurants and hotels. In addition, it provides multimodal information, such as graphics, maps or pictures. The results obtained from an on-line questionnaire conducted with real users reveals the potential and usefulness of such an application in the current society.

URL:

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/viewFile/5510/3269

Named Entity Classification Based on Profiles: A Domain Independent Approach

Enviado por imoreno el Vie, 06/15/2018 - 17:47

This paper presents a Named Entity Classification system, which uses profiles and machine learning based on [6]. Aiming at confirming its domain independence, it is tested on two domains: general - CONLL2002 corpus, and medical - DrugSemantics gold standard. Given our overall results (CONLL2002, F1 = 67.06; DrugSemantics, F1 = 71.49), our methodology has proven to be domain independent.

URL:

https://doi.org/10.1007/978-3-319-59569-6_15

Representación Canónica

Flexiones

Necesidades del Usuario

Financiación

Using the Twitter social network as a predictor in the political decision

A Computational Method for Enabling Teaching-Learning Process in Huge Online Courses and Communities

Cross-Document Event Ordering through Temporal Relation Inference and Distributional Semantic Models

DrugSemantics: A corpus for Named Entity Recognition in Spanish Summaries of Product Characteristics

A Multilingual Multi-domain Data-to-Text Natural Language Generation Approach

Propuesta y desarrollo de una aproximación de generación de resúmenes abstractivos multigénero

Propuesta de un sistema de clasificación de entidades basado en perfiles e independiente del dominio

Diseño, compilación y anotación de un corpus para la detección de mensajes suicidas en redes sociales

TravelSum: A Spanish Summarization Application focused on the Tourism Sector

Named Entity Classification Based on Profiles: A Domain Independent Approach

Páginas

Representación Canónica

Flexiones

Necesidades del Usuario

Financiación

Inicio de sesión

Páginas