De Cristofaro, Tiziano
(2021)
Gestione di dati scientifici tramite tracciamento degli eventi in file system distribuiti.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270]
Documenti full-text disponibili:
Abstract
Presso il centro di calcolo Tier-1 del CNAF la ricerca di eventi sui file, siano essi scritture, accessi, modifiche nei metadati, etc., è attualmente effettuata tramite scansioni dei singoli file system.
Queste operazioni possono richiedere anche diversi minuti e nei prossimi anni, con una previsione di un aumento significativo nella quantità di dati da gestire, potrebbero essere ancora più onerose. Per questi motivi, si intende valutare se e come è possibile superare questo approccio tramite la tracciatura degli eventi che avvengono sui file.
A tal proposito saranno studiate le tecnologie che implementano file system distribuiti come GPFS e
Ceph (più eventuali altre), con particolare attenzione all’implementazione delle funzionalità di
tracciamento degli storage event. L’intercettazione di eventi di storage rilevanti permette di sapere quando questi si verificano, ed eventualmente di gestirli.
È inoltre importante capire se questa soluzione sia davvero scalabile, dovendo andare ad operare nel contesto di un centro di calcolo con decine di nodi e milioni di file.
Sarà inoltre valutata la possibile applicazione di queste funzionalità a casi d’uso concreti del centro di calcolo Tier-1.
Abstract
Presso il centro di calcolo Tier-1 del CNAF la ricerca di eventi sui file, siano essi scritture, accessi, modifiche nei metadati, etc., è attualmente effettuata tramite scansioni dei singoli file system.
Queste operazioni possono richiedere anche diversi minuti e nei prossimi anni, con una previsione di un aumento significativo nella quantità di dati da gestire, potrebbero essere ancora più onerose. Per questi motivi, si intende valutare se e come è possibile superare questo approccio tramite la tracciatura degli eventi che avvengono sui file.
A tal proposito saranno studiate le tecnologie che implementano file system distribuiti come GPFS e
Ceph (più eventuali altre), con particolare attenzione all’implementazione delle funzionalità di
tracciamento degli storage event. L’intercettazione di eventi di storage rilevanti permette di sapere quando questi si verificano, ed eventualmente di gestirli.
È inoltre importante capire se questa soluzione sia davvero scalabile, dovendo andare ad operare nel contesto di un centro di calcolo con decine di nodi e milioni di file.
Sarà inoltre valutata la possibile applicazione di queste funzionalità a casi d’uso concreti del centro di calcolo Tier-1.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
De Cristofaro, Tiziano
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
file system distribuiti,storage events,GPFS,IBM Spectrum Scale,Ceph,sistemi distribuiti,INFN,CNAF,dati scientifici,cluster,file system,notifiche
Data di discussione della Tesi
28 Maggio 2021
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
De Cristofaro, Tiziano
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
file system distribuiti,storage events,GPFS,IBM Spectrum Scale,Ceph,sistemi distribuiti,INFN,CNAF,dati scientifici,cluster,file system,notifiche
Data di discussione della Tesi
28 Maggio 2021
URI
Statistica sui download
Gestione del documento: