Productos

Buscador Tabarca

www.tabarca.com

Buscador de páginas web de la comunidad valenciana: Se trata de un sistema de recuperación de información que a partir de una determinada entrada, ya sean frases completas en lenguaje natural o bien un conjunto de palabras clave, obtiene como salida una relación de documentos ordenada según la relevancia de cada uno respecto a la consulta. Actualmente el buscador tiene alrededor de 50.000 páginas web almacenadas, las cuales están escritas en diferentes idiomas (castellano, valenciano e inglés). Estas páginas se actualizan diariamente. Entre estas páginas se destaca el hecho de tener almacenadas todas las páginas correspondientes a la Universidad de Alicante, incluyendo los dossier de prensa.

Sistema de Recuperación de Información IR-n.

Los sistemas de recuperación de información se encargan de procesar una colección de textos y entre todos ellos seleccionar aquellos que contengan algún término relacionado con la pregunta y descartando los que no esten relacionados. El sistema IR-n es un sistema de recuperación de información basada en pasajes que utiliza un modelo probabilístico como motor de búsqueda y además utiliza un módulo de expansión de la pregunta que mejora los resultados obtenidos. Este sistema ha participado en concursos internacionales como el CLEF.

Sistema de Extracción de Información.

Los sistemas de extracción de información, al contrario que los sistemas anteriores, parten de una colección de textos pertenecientes todos a un mismo dominio y que contiene información considerada relevante para la aplicación. Estos sistemas tienen como objetivo principal localizar en los textos determinada información para poder rellenar una base de datos a la cuál podamos hacer preguntas. Con ello se consigue transformar información no estructurada en información estructurada.

Sistema de Recuperación y Extracción de Información Notarial.

Esta aplicación ha sido desarrollada en el seno del Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información como consecuencia de la transferencia tecnológica realizada en las áreas de Recuperación de y Extracción de Información. La aplicación está formada por dos módulos principales: el sistema de Recuperación de Información IR-n y el sistema de Extracción de Información adecuadamente adaptados al dominio de aplicación: la información notarial.

Desambiguación de Sentidos por el método de Marcas de Especificidad.

Esta aplicación asigna sentidos a las palabras según el diccionario electrónico EuroWordNet, tanto en español como en inglés.

productos.txt · Última modificación: 2009/02/24 17:32 por armando
CC Attribution-Noncommercial-Share Alike 3.0 Unported www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0