Towards predictive maintenance in High Performance Computing using Deep autoencoder networks: a preliminary study on Marconi100 supercomputer

Brescia, Silvia (2021) Towards predictive maintenance in High Performance Computing using Deep autoencoder networks: a preliminary study on Marconi100 supercomputer. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (10MB)

Abstract

I sistemi HPC, sono macchine complesse con componenti eterogenei che possono rompersi o avere dei malfunzionamenti. Queste problematiche possono provocare ingenti danni sia a livello economico che all’infrastruttura stessa. Allo stato dell’arte il rilevamento automatico delle anomalie su questi sistemi è una attività molto complicata e critica. Quello da cui si può trarre vantaggio per questo scopo è l’enorme quantità di dati provenienti da infrastrutture di monitoraggio di cui questi sistemi sono equipaggiati. Infatti la novità introdotta degli algoritmi di Machine Learning è la capacità di analizzare grandi quantitativi di dati e identificare in modo proattivo potenziali problematiche e relative cause. Questo lavoro di tesi ha l’obiettivo di condurre un’analisi preliminare, usando diversi modelli basati su tecniche di Deep Learning, per capire se è possibile fare anomaly detection e manutenzione predittiva su sistemi HPC. In particolare lo studio si svolge sul supercomputer MARCONI100 del Cinceca, di cui per la prima volta vengono analizzati i dati.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Brescia, Silvia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
sistemi HPC,Marconi100,anomaly detection,Deep Learning,predictive maintenance,supercomputer,machine learning,autoencoder,keras
Data di discussione della Tesi
21 Luglio 2021
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^