Neri, Matteo
(2015)
Studi di data popularity nell'analisi distribuita su Grid dell'esperimento CMS a LHC.
[Laurea], Università di Bologna, Corso di Studio in
Fisica [L-DM270]
Documenti full-text disponibili:
Abstract
L’esperimento CMS a LHC ha raccolto ingenti moli di dati durante Run-1, e sta
sfruttando il periodo di shutdown (LS1) per evolvere il proprio sistema di calcolo.
Tra i possibili miglioramenti al sistema, emergono ampi margini di ottimizzazione
nell’uso dello storage ai centri di calcolo di livello Tier-2, che rappresentano - in
Worldwide LHC Computing Grid (WLCG)- il fulcro delle risorse dedicate all’analisi
distribuita su Grid.
In questa tesi viene affrontato uno studio della popolarità dei dati di CMS
nell’analisi distribuita su Grid ai Tier-2. Obiettivo del lavoro è dotare il sistema di
calcolo di CMS di un sistema per valutare sistematicamente l’ammontare di spazio
disco scritto ma non acceduto ai centri Tier-2, contribuendo alla costruzione di un
sistema evoluto di data management dinamico che sappia adattarsi elasticamente
alle diversi condizioni operative - rimuovendo repliche dei dati non necessarie o
aggiungendo repliche dei dati più “popolari” - e dunque, in ultima analisi, che possa
aumentare l’“analysis throughput” complessivo.
Il Capitolo 1 fornisce una panoramica dell’esperimento CMS a LHC.
Il Capitolo 2 descrive il CMS Computing Model nelle sue generalità, focalizzando
la sua attenzione principalmente sul data management e sulle infrastrutture
ad esso connesse.
Il Capitolo 3 descrive il CMS Popularity Service, fornendo una visione d’insieme
sui servizi di data popularity già presenti in CMS prima dell’inizio di questo
lavoro.
Il Capitolo 4 descrive l’architettura del toolkit sviluppato per questa tesi, ponendo
le basi per il Capitolo successivo.
Il Capitolo 5 presenta e discute gli studi di data popularity condotti sui dati
raccolti attraverso l’infrastruttura precedentemente sviluppata.
L’appendice A raccoglie due esempi di codice creato per gestire il toolkit attra-
verso cui si raccolgono ed elaborano i dati.
Abstract
L’esperimento CMS a LHC ha raccolto ingenti moli di dati durante Run-1, e sta
sfruttando il periodo di shutdown (LS1) per evolvere il proprio sistema di calcolo.
Tra i possibili miglioramenti al sistema, emergono ampi margini di ottimizzazione
nell’uso dello storage ai centri di calcolo di livello Tier-2, che rappresentano - in
Worldwide LHC Computing Grid (WLCG)- il fulcro delle risorse dedicate all’analisi
distribuita su Grid.
In questa tesi viene affrontato uno studio della popolarità dei dati di CMS
nell’analisi distribuita su Grid ai Tier-2. Obiettivo del lavoro è dotare il sistema di
calcolo di CMS di un sistema per valutare sistematicamente l’ammontare di spazio
disco scritto ma non acceduto ai centri Tier-2, contribuendo alla costruzione di un
sistema evoluto di data management dinamico che sappia adattarsi elasticamente
alle diversi condizioni operative - rimuovendo repliche dei dati non necessarie o
aggiungendo repliche dei dati più “popolari” - e dunque, in ultima analisi, che possa
aumentare l’“analysis throughput” complessivo.
Il Capitolo 1 fornisce una panoramica dell’esperimento CMS a LHC.
Il Capitolo 2 descrive il CMS Computing Model nelle sue generalità, focalizzando
la sua attenzione principalmente sul data management e sulle infrastrutture
ad esso connesse.
Il Capitolo 3 descrive il CMS Popularity Service, fornendo una visione d’insieme
sui servizi di data popularity già presenti in CMS prima dell’inizio di questo
lavoro.
Il Capitolo 4 descrive l’architettura del toolkit sviluppato per questa tesi, ponendo
le basi per il Capitolo successivo.
Il Capitolo 5 presenta e discute gli studi di data popularity condotti sui dati
raccolti attraverso l’infrastruttura precedentemente sviluppata.
L’appendice A raccoglie due esempi di codice creato per gestire il toolkit attra-
verso cui si raccolgono ed elaborano i dati.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Neri, Matteo
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
data popularity, CMS
Data di discussione della Tesi
20 Marzo 2015
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Neri, Matteo
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
data popularity, CMS
Data di discussione della Tesi
20 Marzo 2015
URI
Statistica sui download
Gestione del documento: