Recursos

Durante muchos años, el Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información ha estado investigando sobre tecnologías de la información y el procesamiento del lenguaje. Esta ardua labor de investigación ha dado como fruto recursos lingüisticos como corpus etiquetados, colecciones de documentos y ontologías que ponemos a vuestra disposición para investigación.

Concit-Corpus: Análisis del Contexto de la Cita para el aprendizaje de la Función, Polaridad e Influencia

El análisis de citas bibliográficas que usa variaciones de métodos de conteo provoca deformaciones en la evaluación del impacto. Para enriquecer el cálculo de los factores de impacto se necesita entender el tipo de influencia de los aportes de un investigador sobre el autor que los menciona. Para ello, se requiere realizar análisis de contenido del contexto de las citas que permita obtener su función, polaridad e influencia. El presente corpus trata sobre la definición de un esquema de anotación tendiente a la creación de un corpus de acceso público que sea la base de trabajo colaborativo en este campo, con miras al desarrollo de sistemas que permitan llevar adelante tareas de análisis de contenido con el objetivo planteado.

Versión: 
1.0.0

Concit-Corpus: Context Citation Analysis to learn Function, Polarity and Influence

Citation analysis that uses counting methods causes deformations in impact factor assessment. To enrich impact factor calculation is necessary to understand the kind of influence that the contributions of an author have over another ́s work. For this purpose, it is required to perform citation content analysis to obtain its function, polarity and influence in a context within an article that mentioned it. In this corpus, we focus in the definition of an annotation scheme aimed at creating a public access corpus that be the basis of collaborative work in this field, in order to develop citation content analysis to obtain criteria for impact evaluation.

Versión: 
1.0.0

Digital Media Asset

English: Today's generation of Internet devices has changed how users are interacting with media, from passive and unidirectional users to proactive and interactive. Users can use these devices to comment or rate a TV show and search for related information regarding characters, facts or personalities. This phenomenon is known as second screen. This resource provides an ontology for representing Media Assets as part of  the SAM project, an EU-funded research project that focuses on developing an advanced digital media delivery platform based on second screen interaction and content syndication within a social media context, providing open and standardised ways of characterising, discovering and syndicating digital assets.

Versión: 
1.0.0

EmotiBlog

El esquema de anotación y el corpus de Emotiblog son un recurso multilingue que fue creado para detectar la subjetividad en los nuevos géneros textuales de la Web 2.0 con la intención de contribuir en la mejora de las tareas de Análisis de Sentimientos.

Este corpus ha sido etiquetado con una granularidad fina sobre análisis de sentimientos en 3 dominios distintos.

Advertencia: Este recurso es gratuito para investigación y debe ser referenciado convenientemente al siguiente artículo científico:

Versión: 
1.0.0

ONTOLegoLangUAge

ONTOLegolangUAge is an ontology that motivates the importance of associating linguistic information with standard ontologies and expressive models, beyond the label systems implemented in RDF and OWL. It is crucial to capture correctly the relation between natural language constructs and ontological structures. 

Download

Versión: 
1.0.0

Semantic Package

This ontology aims to capture the semantics of documents through a set of key aspects in texts, such as the temporal dimension, presence of named entities, detection of opinionated information, or conceptual classifications. In addition, the ontology provides a lexical dimension, where the sentence of each document, and a possible summary derived from it, are taken into account.

Download

Versión: 
1.1.0