Evaluación de nuevas arquitecturas de IA para la estimación de la incertidumbre

Pautsch, Erik; Li, John; Rizzi, Silvio; Thiruvathukal, George K.; Pantoja, Maria

doi:https://doi.org/10.29375/25392115.5274

Evaluación de nuevas arquitecturas de IA para la estimación de la incertidumbre

Archivos

Principal Articulo 3.pdf (799.26 KB)

Fecha

2024-06-18

Autores

Pautsch, Erik

Li, John

Rizzi, Silvio

Thiruvathukal, George K.

Pantoja, Maria

Autores

Pautsch, Erik

Li, John

Rizzi, Silvio

Thiruvathukal, George K.

Pantoja, Maria

Editor

Universidad Autónoma de Bucaramanga UNAB

Compartir

Seleccione un PDF para visualizar:

Seleccione un documento PDF para visualizar

Resumen

El Aprendizaje Profundo (AP) ha hecho avanzar la visión por ordenador, ofreciendo un rendimiento impresionante en tareas visuales complejas. Sin embargo, persiste la necesidad de estimaciones precisas de la incertidumbre, en particular para las entradas fuera de distribución (OOD, en su acrónimo en inglés). Nuestra investigación evalúa la incertidumbre en Redes Neuronales Convolucionales (CNN, en inglés) y transformadores de visión (ViT, en inglés) utilizando los conjuntos de datos MNIST e ImageNet-1K. Utilizando plataformas de Alto Rendimiento (HPC, en inglés), incluidos el superordenador tradicional Polaris y aceleradores de IA como Cerebras CS-2 y SambaNova DataScale, evaluamos los méritos computacionales y los cuellos de botella de cada plataforma. En este artículo se describen las consideraciones clave para utilizar la HPC en la estimación de la incertidumbre en el AP, y se ofrecen ideas que guían la integración de algoritmos y hardware para aplicaciones de AP robustas, especialmente en visión por ordenador.