Ponente
Descripción
El objetivo del trabajo fue investigar la aplicación de Vision Transformers(ViT) para la clasificación de imágenes de la piel con el fin de detectar las diferentes enfermedades dermatológicas. Se implementaron técnicas de data augmentation con el objetivo de equilibrar las clases en el conjunto de datos y mejorar la generalización del modelo, se aplicaron transformaciones como rotación, reflejo y generación avanzada de imágenes sintéticas para mitigar el desequilibrio entrecategorías de enfermedades. Sin embargo, los resultados mostraron que estas técnicas no aportaron mejoras significativas en la precisión. El uso de transformers en esta problemática representò un enfoque novedoso y poderoso debido asu capacidad para capturar relaciones a largo alcance en las imágenes mediante mecanismos de atención. A diferencia de las redes convolucionales tradicionales,los ViT pueden procesar la información de manera global, lo que les permite identificar patrones complejos sin depender de estructuras locales predefinidas.Esta característica los hace especialmente adecuados para la clasificación de imágenes médicas, donde las variaciones en la apariencia de las lesiones puedenser sutiles y difíciles de detectar mediante métodos convencionales. Los resultados obtenidos indican que el modelo alcanzó una precisión de 89.02% usando losdatos del International Skin Imaging Collaboration(ISIC). Los ViT demostraron ser una herramienta efectiva para la clasificación de imágenes dermatológicas,sin requerir una gran cantidad de data augmentation lo que sugiere que ya son capaces de extraer características discriminativas de manera eficiente.