Ponente
Descripción
Se presenta el desarrollo de un prototipo basado en modelos de lenguaje grande (LLM) para mejorar la interacción con los anuarios estadísticos de la
Oficina Nacional de Estadística e Información (ONEI) de Cuba. Este utiliza un enfoque combinado: Generación Aumentada por Recuperación (RAG),
internamente apoyado mediante embeddings para optimizar resultados; además asegura una correcta interacción con el LLM mediante técnicas avanzadas conocidas
como Prompt Engineering. Este diseño combina recuperación y generación textual mediante LLM, lo cual permite optimizar tanto precisión como relevancia al
fundamentarse en contextos donde coexisten datos estructurados y no estructurados.
A través del diseño modular implementado –que incluye extracción procesamiento
recuperación y generación— este sistema facilita tanto interpretar datos tabulares
como textos no estructurados presentes en los anuarios estadísticos publicados.