Compresión de redes neuronales para microcontroladores utilizando la técnica de cuantificación
Trabajo de grado - Pregrado
2024
Universidad Francisco de Paula Santander
San José de Cúcuta
La presente investigación tuvo como objetivo principal analizar el impacto de la cuantificación en las redes neuronales para su implementación en microcontroladores, comparando tres tipos de técnicas diferentes en un modelo de red neuronal diseñado para realizar la predicción de radiación, esto teniendo en cuenta un diseño experimental que permitió recopilar los datos de las métricas en inferencia, degradación de la precisión, consumo de energía y tamaño del modelo en memoria. Así, se llega a la conclusión que la cuantificación es una herramienta útil para lograr una reducción significativa del tamaño de los modelos de redes neuronales sin comprometer su rendimiento, obteniendo también un equilibrio respecto a la eficiencia de recursos de hardware en dispositivos con características limitadas como lo son los microcontroladores.