Análisis de métricas de evaluación para la tarea de Generación Automática de Resúmenes

Dentro de las tareas realizadas para esta actividad,  se ha realizado un análisis de métricas existentes para la evaluación de resúmenes automáticos. Se adjunta el informe en formato de presentación. Las conclusiones extraídas tras este análisis se resumen en los siguientes apartados:

  • actualmente predomina la evaluación intrínseca frente a la extrínseca
  • para evaluar  el contenido de un resumen de forma automática(evaluación cuantitativa), la herrramienta más utilizada en la literatura es ROUGE, que integra métricas de similitud basadas en n-gramas
  • para evaluar la calidad de un resumen (evaluación cualitativa) sigue predominando la evaluación manual a partir de la puntuación en base a escalas Likert usando los criterios lingüísiticos definidos en las competiciones DUC/TAC.