27–29 de mayo de 2025 Ciencias Naturales, Exactas y Ténicas
Facultad de Matemática y Computación
America/Havana zona horaria

Evolución de Pipelines de AutoML mediante Optimización Metaheurística Impulsada por Modelos de Lenguaje

No programado
20m
Facultad de Matemática y Computación

Facultad de Matemática y Computación

Facultad de Matemática y Computación, Universidad de La Habana, San Lázaro y L, Vedado, Plaza de la Revolución, La Habana, Cuba

Ponente

Leonardo Javier Ramírez Calatayud (Universidad de la Habana)

Descripción

En un mundo donde la demanda de soluciones automatizadas de Machine Learning (ML) crece exponencialmente, esta investigación propone un marco innovador que combina algoritmos evolutivos con Modelos de Lenguaje Grandes (LLMs) para revolucionar la construcción de pipelines de AutoML. El objetivo central es eliminar la dependencia de configuraciones manuales y optimizaciones ineficientes, ofreciendo un sistema autónomo que genera, evalúa y mejora pipelines mediante la sinergia entre metaheurísticas y la capacidad semántica de LLMs como Gemini, LLaMA y Mixtral.

La propuesta integra un algoritmo genético adaptado donde los LLMs actúan como arquitectos inteligentes: generan código ejecutable, diseñan funciones de evaluación contextualizadas y optimizan iterativamente los pipelines mediante mutación y recombinación guiadas. Los experimentos, realizados en seis datasets diversos (desde diagnóstico médico hasta predicción financiera), demostraron que estrategias como algs —que construye pipelines paso a paso— superan en rendimiento a enfoques tradicionales, logrando mejoras de hasta un 15% frente a baselines como regresión logística o random forests. Modelos como Gemini-2.0 Flash destacaron por su eficiencia y baja tasa de errores, validando la viabilidad de usar LLMs como núcleo de AutoML.

Este trabajo no solo sienta las bases para sistemas de ML más accesibles y adaptativos, sino que también reduce barreras técnicas al permitir que usuarios no expertos desarrollen modelos robustos mediante instrucciones naturales. Los resultados abren puertas a futuras investigaciones en hibridación con otras metaheurísticas, generalización a dominios complejos y escalabilidad en entornos federados.

Autores primarios

Alejandro Piad Morffis (Universidad de La Habana) Daniel Alejandro Valdes Perez (Universidad de La Habana) Leonardo Javier Ramírez Calatayud (Universidad de la Habana)

Materiales de la presentación

Todavía no hay materiales.