Documenti full-text disponibili:
Abstract
In questa tesi analizzeremo le prestazioni di un System on Chip (SoC) in alcuni contesti di calcolo parallelo: in questo caso il SoC in questione è il Raspberry Pi. L'ultima versione rilasciata (Raspberry Pi 3 B+) è dotata di 1 GB di RAM e di un processore quad-core con architettura ARM NEON, caratterizzata dai prezzi e consumi ridotti. Tali specifiche danno i presupposti per un inserimento di questo dispositivo in contesti di high performace computing (HPC) tramite l'utilizzo di una programmazione parallela specifica.
Per valutare le prestazioni di questa scheda si è voluto implementare un'applicazione che sia di uso comune in ambienti HPC, evitando semplici benchmark sulle singole componenti hardware. L'applicazione deve inoltre essere implementata tenendo conto dell'architettura di cui si dispone, in modo da ottenere risultati quanto più possibili legati alle caratteristiche hardware.
Il progetto prevede di sviluppare un sistema di machine learning: una rete neurale artificiale che si addestra nel riconoscere cifre scritte a mano libera. Verranno quindi descritte e implementate alcune tecniche per parallelizzare la fase di addestramento della rete neurale.
Questa applicazione verrà sfruttata per effettuare dei benchmark sia sul Raspberry Pi, che su un calcolatore "standard": l'università di Bologna ha messo a disposizione un server di calcolo che dispone di due processori Intel Xeon. I dati raccolti su queste due architetture (Raspberry Pi e Xeon) saranno messi a confronto. L'obiettivo è quello di analizzare se effettivamente dispositivi come il Raspberry Pi possono avere un qualche tipo di vantaggio in contesti HPC: in particolare verrà svolta un'analisi sulla capacità di svolgere calcolo parallelo.
Abstract
In questa tesi analizzeremo le prestazioni di un System on Chip (SoC) in alcuni contesti di calcolo parallelo: in questo caso il SoC in questione è il Raspberry Pi. L'ultima versione rilasciata (Raspberry Pi 3 B+) è dotata di 1 GB di RAM e di un processore quad-core con architettura ARM NEON, caratterizzata dai prezzi e consumi ridotti. Tali specifiche danno i presupposti per un inserimento di questo dispositivo in contesti di high performace computing (HPC) tramite l'utilizzo di una programmazione parallela specifica.
Per valutare le prestazioni di questa scheda si è voluto implementare un'applicazione che sia di uso comune in ambienti HPC, evitando semplici benchmark sulle singole componenti hardware. L'applicazione deve inoltre essere implementata tenendo conto dell'architettura di cui si dispone, in modo da ottenere risultati quanto più possibili legati alle caratteristiche hardware.
Il progetto prevede di sviluppare un sistema di machine learning: una rete neurale artificiale che si addestra nel riconoscere cifre scritte a mano libera. Verranno quindi descritte e implementate alcune tecniche per parallelizzare la fase di addestramento della rete neurale.
Questa applicazione verrà sfruttata per effettuare dei benchmark sia sul Raspberry Pi, che su un calcolatore "standard": l'università di Bologna ha messo a disposizione un server di calcolo che dispone di due processori Intel Xeon. I dati raccolti su queste due architetture (Raspberry Pi e Xeon) saranno messi a confronto. L'obiettivo è quello di analizzare se effettivamente dispositivi come il Raspberry Pi possono avere un qualche tipo di vantaggio in contesti HPC: in particolare verrà svolta un'analisi sulla capacità di svolgere calcolo parallelo.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Barbieri, Edoardo
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
System on Chip,Raspberry Pi,calcolo parallelo,High performance computing,Machine learning,Deep learning,Trasformazione affine,MNIST database
Data di discussione della Tesi
18 Ottobre 2018
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Barbieri, Edoardo
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
System on Chip,Raspberry Pi,calcolo parallelo,High performance computing,Machine learning,Deep learning,Trasformazione affine,MNIST database
Data di discussione della Tesi
18 Ottobre 2018
URI
Statistica sui download
Gestione del documento: