QUMLAUDE: QUantum Mechanics for LAnguage Understanding anD gEneration
En los últimos años se han producido avances significativos en el Procesamiento del Lenguaje Natural (PLN) gracias al desarrollo de los Grandes
Modelos del Lenguaje (LLM) y a su capacidad para comprender y generar texto, así como para abordar con éxito distintas aplicaciones. A pesar de que el número, el tamaño y las capacidades de los LLM no dejan de crecer, siguen presentando una serie de limitaciones y retos, no sólo relacionados con su coste computacional y las necesidades de datos de entrenamiento, sino también con su rendimiento a la hora de resolver algunos fenómenos y tareas lingüísticas que pueden afectar en gran medida a la confianza y fiabilidad de los sistemas de IA. Debido a estas limitaciones y en paralelo a este gran desarrollo del LLM, otras áreas de investigación emergentes están empezando a despertar el interés de la comunidad científica. Una de estas áreas emergentes está relacionada con la aplicación de los principios de la mecánica cuántica al campo de la IA, y más concretamente al PLN (QPLN). La motivación para combinar la computación cuántica y el PLN radica en la capacidad de los sistemas cuánticos para manejar datos complejos y de alta dimensión de forma más eficiente. Por un lado, los ordenadores cuánticos acelerarán exponencialmente tareas como el análisis semántico, la generación de resúmenes, la clasificación de textos y la generación de embedding, que son costosas en los sistemas clásicos. Por otro lado, los algoritmos cuánticos podrían facilitar modelos lingüísticos más avanzados y técnicas para captar matices sutiles en los datos textuales, así como permitir un procesamiento más eficiente de textos largos, mejorando la capacidad de condensar información rápidamente. Sin embargo, esto sigue siendo en gran medida teórico, aún en fase incipiente, ya que todavía no hay implementaciones prácticas que hayan demostrado estos beneficios.
Nuestro proyecto, QUantum Mechanics for LAnguage Understanding anD gEneration (QUMLAUDE), pretende investigar cómo la representación
cuántica de la información y los algoritmos cuánticos pueden usarse para abordar tareas de PLN complejas como la simplificación y el resumen de
textos. Aprovechando algoritmos de inspiración cuántica, pretendemos modelar fenómenos lingüísticos con especial atención a la representación
semántica -como los embeddings contextuales, la composición semántica y las metáforas-, donde los avances cuánticos prometen ofrecer resultados más exactos y precisos en comparación con los métodos actuales.
Para lograr con éxito el objetivo del proyecto, el trabajo de investigación del proyecto se ha organizado en seis módulos, con una duración total de 3
años: Representación cuántica del texto (M1); Algoritmos cuánticos y de inspiración cuántica para la PLN (M2); Integración de la teoría cuántica en
tareas y aplicaciones de PLN (M3); Caso de uso: Sistema de generación aumentada de recuperación para el ámbito de la innovación (M4); Difusión
(M5) y Coordinación del proyecto (M6).
El proyecto QUMLADUE reúne a un equipo multidisciplinar de expertos en lingüística, ciencias computacionales y ciencias experimentales, lo que sitúa al proyecto a la vanguardia de la innovación en computación cuántica. Nuestra investigación no sólo profundizará en nuestra comprensión de la PLN mejorada cuánticamente, sino que también fomentará nuevos estándares en aplicaciones de computación cuántica.
