Overview about the main challenges in Online Social Networks related to geography and temporal events.
El recurso Twitter Dataset consta de 1000 términos anotados de forma manual extraídos de textos de la red Twitter con el objetivo de evaluar sistemas de normalización de textos de la Web 2.0.
Dichos términos han sido etiquetados en 3 categorías y se ha anotado la forma normalizada para cada uno de ellos.
Etiquetas empleadas:
La herramienta GPLSI Twits Observer del Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información de la Universidad de Alicante ha salido en varios médios como La Crónica Virtual, Diario Información, ADN, La Verdad. Este sistema, que permite valorar las opiniones de los usuarios de Twitter sobre un tema dado de forma automática, analizó ayer, lunes 8 de noviembre, el debate entre Alfredo Pérez Rubalcaba y Mariano Rajoy dando como vencedor por una pequeña diferencia a éste último.