El profesor Mikhail Alexandrov nos presenta el Group Method of Data Handling, un método inductivo predictivo para resolver tareas de aprendizaje automático. En el cual, busca la optimización de la estructura (o del modelo) en vez de buscar la optimización de los parámetros. Este algoritmo se considera un algoritmo evolutivo de la inteligencia artificial. El ojetivo del GMDH es buscar el grado de complejidad óptima dentro de una clase dada. Ésta clase debe ser especificada de antemano.
Este método se usa cuando falta informacion priori de la estructura del modelo y la distribución de sus parámetros. También se utiliza un número muy pequeño de datos xperimentales, hast que un número de parámetros del modelo es mayor que el número de observaciones. Lo normal es que el número de datos tenga que ser 4 o 5 veces mayores que el número de parámetros para que funcione los métodos tradicionales, sin embargo, el método GMDH funciona mejor. No aconseja no utilizar este modelo cuando otras aplicaciones sean factibles, es decir, que hayan muchos datos y que tengamos la estructura. Una buena aplicación de este modelo es para definir la estructura de las redes neuronales.
Un requisito para el GMDH es que se debe definir la clase de estructura, es decir, el tipo de clasificador. Con esta información, el GMDH intenta buscar un modelo que no tenga mucha sensiblidad a los datos, es decir, que no cambie en demasía si se introducen nuevos datos. Tambien debe haber un criterio de incondicionalidad (unbiasdeness), es decir, que el modelo debe ser parecido independientemente de qué parte de los datos se usan.
Los pasos para aplicar:
Definir una serie de modelos.
Los datos experimentales se deben dividir en dos partes
Se fija un nivel de complejidad y se construye un modelo para cada conunto de datos y entrenamos con el primero y evaluamos con el segundo (criterio interno)
Se comparan de nuevo los modelos usando el criterio externo (incondicionalidad)
Se requiere de una tercera parte del corpus para evaluar el sistema.
Con este algoritmo se realizan varias estrategias de búsqueda de los mejores modelos. Estos algorimos son:
COMBI - Combinacion de todos los modelos de los niveles con los niveles anteriores
MULTI - Sólo se combinan los p mejores
MIA - Uso de técnicas parecieas a las de redes neuronales
RIA - Lo mismo que MIA pero con algunas regresiones para cubrir más modelos.