Tecniche di compressione di reti neurali per dispositivi IoT

Agarbati, Stefano (2026) Tecniche di compressione di reti neurali per dispositivi IoT. [Laurea], Università di Bologna, Corso di Studio in Ingegneria elettronica, informatica e telecomunicazioni [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Il successo delle reti neurali moderne in diversi domini applicativi è stato accompagnato da un aumento della loro complessità e dei relativi requisiti computazionali, che ne limitano l'impiego in ambienti con risorse limitate, tra cui dispositivi IoT. La ricerca si è quindi orientata verso lo sviluppo di tecniche di compressione volte a ridurre le dimensioni dei modelli ed ottimizzare i tempi di inferenza e addestramento. In questa tesi si descrivono la sparsificazione e la quantizzazione come tecniche di compressione di reti neurali, illustrandone le basi teoriche e le applicazioni pratiche, allo scopo di valutare fino a che punto possano essere applicate in scenari reali. Dal punto di vista teorico, entrambe promettono significativi vantaggi in termini di riduzione della dimensione dei modelli e del tempo di inferenza, a fronte di un possibile degrado dell'accuratezza dipendente dal grado di compressione. Vengono descritte alcune delle principali tecnologie che ne consentono l'implementazione su dispositivi edge, insieme a casi di studio relativi all'impiego di modelli compressi in contesti applicativi reali. Le tecnologie e le applicazioni esposte mostrano l'efficacia delle tecniche nella riduzione dei requisiti computazionali spaziali e temporali, e la possibilità concreta di esecuzione di modelli ottimizzati su dispositivi con risorse vincolate. Tuttavia è sempre necessario un compromesso tra compressione ed accuratezza. Inoltre i benefici effettivi dipendono dal supporto fornito a livello software e hardware. In futuro si prevede uno sviluppo sinergico fra tecniche di compressione, supporti hardware e software, unitamente allo sviluppo di nuove architetture intrinsecamente più efficienti per favorire l'esecuzione dei modelli in ambito IoT.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Agarbati, Stefano
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
sparsificazione,quantizzazione,tecniche,compressione,reti, neurali,IoT,tensorRT,LiteRT(TFLite),ExecuTorch,ONNX Runtime,TensorFlow,PyTorch
Data di discussione della Tesi
13 Marzo 2026
URI

Altri metadati

Gestione del documento: Visualizza il documento

^