En mi último post hablaba de los sistemas de integración de recursos y herramientas que son útiles en para la investigación en tecnologías de la información presentando uno de los frameworks de integración de más auge: el UIMA. Hoy os voy a hablar de un sistema que utiliza otro conocido framework, el GATE, como base (del cuál hablaré próximamente) para realizar una integración basada en computación nube. Esta plataforma se llama GATECloud.
En el artículo titulado GATECloud.net: Cloud Infrastructure for Large-Scale, Open-Source Text Processing, publicado en las actas del AHM 2011, Tablan et al. nos explican brevemente, en un artículo corto de 3 páginas, las líneas generales de esta plataforma basada en la familia GATE de software, más concretamente en sus versiones servidoras GATE Teamware y GATE Mimir. Con estas plataformas servidoras montan un cluster de ordenadores en Amazon que nos permite definir Annotation Jobs y flujos de trabajos entre estos al puro estilo GATE. El usuario final simplemente tiene que definir estos flujos de trabajos y subir los documentos de entrada y el sistema ejecuta todo el proceso de forma paralela en el cluster consiguiendo tiempos muy reducidos de procesamiento. Finalmente, cuando el trabajo termina, GATECloud envía un email para que el usuario se descargue los archivos resultantes.
El principal problema de este artículo es su brevedad que no se centra en el detalle sino una visión global. Otras críticas es la única referencia bibliográfica a un artículo de los propios autores que, en mi opinión, no viene a colación.