CORTEX: Generación consciente de texto
La integración efectiva del conocimiento mundial y externo en las arquitecturas NLG mejora la capacidades de razonamiento de sentido común de los sistemas NLG. Consideramos que potenciando el sentido común en las capacidades de razonamiento de los sistemas NLG es necesario para producir automáticamente datos precisos, correctos y textos fieles que estarán en consonancia con hechos reales.
Proponemos una nueva generación de sistemas NLG basados en el conocimiento que superan el fenómeno de “alucinación” y que evitan la generación de lenguaje natural que sea «económico con la verdad». Esto es posible dado que los Transformers, un tipo de arquitectura que predomina en la generación de texto, pueden ser afinados, entrenados y adaptados, para que: 1) puedan aprender a generalizar e identificar información implícita; y, 2) pueden tomar en cuenta ciertas características que el texto generado debe reflejar, tales como estructura, extensión, estilo, formalidad, etc., permitiendo así un control más controlado y una generación más precisa. Este tipo de ajustes ayudarían, por un lado, a generar textos en un manera más natural, diversa y semántica, y por otro, a detectar patrones extraños o sesgos que deban evitarse en el texto generado. Además, el control de diferentes aspectos del texto es clave para aplicar y transferir con éxito los sistemas NLG a escenarios reales que son relevantes para la industria y para la sociedad. (Len et al., 2020).