Evaluación de nuevas arquitecturas de IA para la estimación de la incertidumbre

Cargando...
Miniatura

Autores

Pautsch, Erik
Li, John
Rizzi, Silvio
Thiruvathukal, George K.
Pantoja, Maria

Autores

Pautsch, Erik    logo-ORCID   
Li, John    logo-ORCID   
Rizzi, Silvio    logo-ORCID   
Thiruvathukal, George K.    logo-ORCID   
Pantoja, Maria    logo-ORCID   

Otros contribuidores

Director / Asesor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Autónoma de Bucaramanga UNAB

Seguimiento al proceso del trabajo

Compartir

Seleccione un documento PDF para visualizar

Resumen

El Aprendizaje Profundo (AP) ha hecho avanzar la visión por ordenador, ofreciendo un rendimiento impresionante en tareas visuales complejas. Sin embargo, persiste la necesidad de estimaciones precisas de la incertidumbre, en particular para las entradas fuera de distribución (OOD, en su acrónimo en inglés). Nuestra investigación evalúa la incertidumbre en Redes Neuronales Convolucionales (CNN, en inglés) y transformadores de visión (ViT, en inglés) utilizando los conjuntos de datos MNIST e ImageNet-1K. Utilizando plataformas de Alto Rendimiento (HPC, en inglés), incluidos el superordenador tradicional Polaris y aceleradores de IA como Cerebras CS-2 y SambaNova DataScale, evaluamos los méritos computacionales y los cuellos de botella de cada plataforma. En este artículo se describen las consideraciones clave para utilizar la HPC en la estimación de la incertidumbre en el AP, y se ofrecen ideas que guían la integración de algoritmos y hardware para aplicaciones de AP robustas, especialmente en visión por ordenador.

Descripción

Palabras clave

Fuente del recurso

  • Vol. 25 Núm. 2 (2024): Revista Colombiana de Computación (Julio-Diciembre); 23-34

Citación

Aprobación

Revisión

Complementado por

Referenciado por