Se encuentra usted aquí

Recursos

CRiSOL

CRiSOL es el resultado de la combinación de dos recursos lingüísticos destinados al Análisis de Opiniones.

SFU-SRC-Neg

Este corpus es una ampliación del 

COAR

Corpus de opiniones de restaurantes destinado a la investigación en el ámbito de la clasificación de la polaridad a nivel de documento, y se circunscribe en el dominio de aloja

COAH

Corpus de opiniones de hoteles destinado a la investigación en el ámbito de la clasificación de la polaridad a nivel de documento, y se circunscribe en el dominio de alojamiento hotelero (turismo-hoteles).

ML-SentiCon

Se trata de varias listas de lemas positivos y negativos para inglés, español, catalán, gallego y vasco. Cada lema viene acompañado de una estimación numérica de su polaridad (entre -1.0 y 1.0) así como de un valor de desviación típica de dicha polaridad. Las listas están organizadas en varias capas, de manera que las primeras capas contienen estimaciones más precisas de los valores anteriores, aunque contienen menos elementos que las capas posteriores.

SHoRe (Spanish Hotel Reviews)

Corpus compuesto por reviews de hoteles de las islas Canarias y Baleares, escritos por usuarios de TripAdvisor.

SOL

SOL is a list of opinion signal words in Spanish independent of the domain.

For the elaboration of the resource it has begun with the list of words that maintains the professor Bing Liu (Bing Liu's Opinion Lexicon). The list of words has been automatically translated using the translator Reverso.

The list consists of 1,397 positive and 3,151 words. For more information on how the list was developed see the article: Bilingual Experiments on an Opinion Comparable Corpus (in press).

SinaiSACorpus

Este corpus ha sido preparado por el grupo SINAI en Diciembre de 2008. SINAI SA (Análisis de Sentimientos) fue creado rastreando la página web de Amazon. Casi 2000 comentarios se extrajeron de diferentes cámaras.

Estructura: El corpus de SINAI contiene 5 directorios y cada uno representa el número de estrellas por comentario. (ej. el directorio 1 contiene los valorados con una estrella). Cada directorio contiene un fichero en texto plano por documento/comentario.

OCA Corpus

OCA es un corpus en árabe sobre comentarios de películas. Este corpus ha sido generado a partir de comentarios en árabe obtenidos de diferentes páginas web.

Rushdi-Saleh, M., Martín-Valdivia, M. T., Alfonso Ureña-López, L. & Perea-Ortega, J. M. (2011). OCA: Opinion corpus for Arabic. Journal of the American Society for Information Science and Technology.
http://dx.doi.org/10.1002/asi.21598

MCE Corpus

MuchoCine corpus en Inglés (MCE) es la versión traducida del corpus MuchoCine (Spanish Movies Reviews). El corpus de MuchoCine fue elaborado por el investigador Fermín Cruz Mata y presentado en el año 2008 en el número 41 de la revista Procesamiento del Lenguaje Natural en el artículo titulado Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español.

Páginas

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer