GPLSI Wikipedia Characterisation V1.0: Descubrimiento y Vinculación de Entidades a Wikipedia

Clase de la obra: 
Programa de ordenador
Breve descripción: 

GPLSI Wikipedia Characterisation (Descubrimiento y vinculación de entidades a Wikipedia) constituye un servicio web con tecnología RESTful. Este servicio ofrece la funcionalidad de analizar contenidos textuales para descubrir menciones de entidades y enlazarlas a Wikipedia mediante el uso de DBpedia, su versión estructurada. Como resultado se obtiene una lista de sugerencias de URIs de DBpedia (cada URI se corresponde con una página de Wikipedia) por cada entidad, ordenadas por el grado de confianza (en el intervalo [0,1]). Este grado de confianza se se obtiene considerando dos características claves. La primera se corresponde con el número de enlaces entrantes para cada entidad de Wikipedia (más enlaces implica mayor relevancia). La segunda característica es la similitud entre el contexto (lista de palabras adyacentes a la parabra objetivo) de la entidad objetivo y la descripción de cada entidad de Wikipedia. Para este propósito se ha utilizado un algoritmo de desambiguación basado en el paradigma LESK, combinado con estadísticas sobre los enlaces entrantes a las páginas de Wikipedia. Los resultados que alcanza esta tecnología rondan el 70% de F1.

Titular del derecho: 
Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos. Grupo Procesamiento del Lenguaje Natural y Sistemas de Información
¿Está transferida?: 
No
Autores: 
Tomás, David
Gutiérrez, Yoan
Moreno, Isabel