VIVES, Plan de Tecnologías de la Lengua para el valenciano
VIVES, «VIVES, Plan de Tecnologías de la Lengua para el valenciano», se enmarca dentro del Proyecto Estratégico para la Recuperación y Transformación Económica (PERTE) de la Nueva Economía de la Lengua que tiene por objetivo impulsar en España la nueva economía digital basada en el lenguaje natural, aprovechando el potencial español y de las lenguas cooficiales como factor de crecimiento económico y de competitividad internacional en áreas tales como la inteligencia artificial, la traducción, la enseñanza, la producción y divulgación cultural, la investigación y la ciencia.
El primer eje del PERTE, <<Base de conocimiento en español y lenguas cooficiales>>, tiene como objetivo la creación y ampliación de corpus y de modelos de lenguaje asociados que permitan el desarrollo de proyectos de inteligencia artificial y otras tecnologías del lenguaje. Por otro lado, el eje 2 del PERTE, <<Inteligencia Artificial en español>>, recoge entre sus actuaciones previstas el desarrollo de la inteligencia artificial en español y lenguas cooficiales. Así pues, en consonancia con los objetivos del PERTE, este proyecto desarrollará los recursos lingüísticos necesarios (corpus y modelos) para facilitar la incorporación de las lenguas oficiales de España en las más avanzadas aplicaciones de inteligencia artificial.
Los objetivos principales del proyecto VIVES son:
- Creación de corpus masivos (en formato texto y voz) del valenciano.
- Impulsar campañas de adquisición de datos de voz y textos a partir de la participación ciudadana y de los recursos existentes en la administración pública, Les Corts Valencianes, y la radio y televisión valenciana (A Punt). Estudio de las implicaciones de privacidad para las personas y garantía de preservación de la privacidad de estas en la captura y análisis de los datos.
- Generar modelos del lenguaje para cada una de las variedades del valenciano, y establecer correlación y comparación entre ellos. Además, generar modelos del lenguaje especializados en un ámbito concreto (turismo y audiovisual) o en una tarea concreta (por ejemplo, resúmenes y simplificación de textos).
- Definir estrategias de calidad de los datos.
- Estudiar la interacción entre los sistemas que utilizan los modelos del lenguaje y sus usuarios, con un foco especial en las consideraciones éticas de dicha interacción
- Fomentar la inclusión digital en la administración pública, proporcionando herramientas digitales para personas con discapacidad y diversidad cognitiva, para conseguir lenguas accesibles.