Evaluación de nuevas arquitecturas de IA para la estimación de la incertidumbre
Fecha
Autores
Autores
Otros contribuidores
Director / Asesor
Título de la revista
ISSN de la revista
Título del volumen
Editor
Seguimiento al proceso del trabajo
Compartir
Seleccione un documento PDF para visualizar
Resumen
El Aprendizaje Profundo (AP) ha hecho avanzar la visión por ordenador, ofreciendo un rendimiento impresionante en tareas visuales complejas. Sin embargo, persiste la necesidad de estimaciones precisas de la incertidumbre, en particular para las entradas fuera de distribución (OOD, en su acrónimo en inglés). Nuestra investigación evalúa la incertidumbre en Redes Neuronales Convolucionales (CNN, en inglés) y transformadores de visión (ViT, en inglés) utilizando los conjuntos de datos MNIST e ImageNet-1K. Utilizando plataformas de Alto Rendimiento (HPC, en inglés), incluidos el superordenador tradicional Polaris y aceleradores de IA como Cerebras CS-2 y SambaNova DataScale, evaluamos los méritos computacionales y los cuellos de botella de cada plataforma. En este artículo se describen las consideraciones clave para utilizar la HPC en la estimación de la incertidumbre en el AP, y se ofrecen ideas que guían la integración de algoritmos y hardware para aplicaciones de AP robustas, especialmente en visión por ordenador.
Descripción
Palabras clave
Enlace al recurso
Fuente del recurso
- Vol. 25 Núm. 2 (2024): Revista Colombiana de Computación (Julio-Diciembre); 23-34

