Recursos disponibles

Durante muchos años, el Grupo de Procesamiento del Lenguaje Natural ha estado investigando sobre tecnologías de la información y el procesamiento del lenguaje. Esta ardua labor de investigación ha dado como fruto recursos lingüisticos como corpus etiquetados, colecciones de documentos y ontologías que ponemos a vuestra disposición para investigación.

El recurso Twitter Dataset consta de 1000 términos anotados de forma manual extraídos de textos de la red Twitter con el objetivo de evaluar sistemas de normalización de textos de la Web 2.0.

Dichos términos han sido etiquetados en 3 categorías y se ha anotado la forma normalizada para cada uno de ellos.

Etiquetas empleadas: 

Últimas noticias

Noticias científicas