Anomaly Prediction with Temporal Convolutional Networks for HPC Systems

Pizzigati, Lorenzo (2020) Anomaly Prediction with Temporal Convolutional Networks for HPC Systems. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Condividi allo stesso modo 3.0 (CC BY-SA 3.0)

Download (5MB)

Abstract

Per far fronte a esigenze computazionali elevate, necessarie per la risoluzione di problemi complessi, la scienza e le industrie fanno spesso uso di sistemi di calcolo di enormi dimensioni e potenza. I sistemi HPC (High Performance Computing) sono identificabili come un insieme di tanti computer cooperanti e connessi tra loro, chiamati singolarmente “nodi”. I costi da sostenere per l’acquisto o la costruzione di questi sistemi ammontano a svariate decine di milioni di euro. Per questo motivo viene spesso affittata la potenza di calcolo di questi sistemi in modalità on-demand, grazie alla tecnologia del Cloud Computing. In queste circostanze risulta necessario garantire quella che viene definita “qualità del servizio”(QoS) , la quale comprende la disponibilità del sistema (availability). Questo significa che un cluster HPC non deve mai (o quasi) essere inaccessibile a chi ha pagato per usufruirne. L’oggetto di questa tesi di laurea magistrale nasce da questa necessità e si propone di trovare una soluzione costruendo un modello, basato sull’utilizzo di tecniche facenti riferimento all’Intelligenza Artificiale (ed in particolare al Machine Learning), che sia in grado di prevedere in anticipo il sorgere di nuove anomalie nei nodi del sistema, di modo che un amministratore possa intervenire tempestivamente, evitando cosı̀ che questo debba essere reso inaccessibile all’utenza. Il sistema HPC su cui è stato testato il modello è di proprietà di CINECA, un consorzio universitario formato da 67 università italiane e 13 istituzioni, prende il nome di MARCONI e, grazie alla sua potenza di calcolo di 20 Pflops/s, si posiziona al 19esimo posto su scala mondiale in termini di prestazioni.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Pizzigati, Lorenzo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Artifical Intelligence,Anomaly Prediction,HPC systems,Machine Learning,Temporal Convolutional Network,TCN,Convolutional Neural Network,CNN
Data di discussione della Tesi
12 Marzo 2020
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^