Ruggieri, Angelo
(2025)
Applicazione di computazione parallela per l'ottimizzazione di un servizio di Data Management.
[Laurea], Università di Bologna, Corso di Studio in
Informatica [L-DM270]
Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (631kB)
|
Abstract
La gestione efficiente di grandi moli di dati rappresenta una delle sfide più critiche per la fisica delle alte energie moderna, in particolare in vista dell'imminente fase di High-Luminosity LHC, che comporterà un incremento esponenziale delle richieste di archiviazione e accesso.
Questo lavoro di tesi documenta l'evoluzione architetturale di StormTape, il servizio responsabile delle operazioni di staging da nastro magnetico presso il Tier-1 del CNAF-INFN. L'obiettivo primario del progetto è stato il superamento dei limiti di latenza imposti dalle precedenti implementazioni single-threaded, valutando l'adozione di paradigmi di programmazione concorrente offerti dallo standard C++20.
Per validare le prestazioni e la robustezza della nuova implementazione, è stata progettata e sviluppata una suite di load testing personalizzata basata sul framework Locust, capace di simulare pattern di traffico realistici e carichi intensivi.
L'analisi sperimentale ha condotto a risultati significativi e in parte controintuitivi. Sebbene il parallelismo offra vantaggi teorici, i test hanno evidenziato come l'interazione con filesystem distribuiti complessi (GPFS) in un contesto fortemente I/O bound possa introdurre instabilità se non gestita con estrema cautela. I benchmark dimostrano che l'incremento prestazionale più rilevante e stabile è stato ottenuto non attraverso la massimizzazione della concorrenza, bensì tramite l'ottimizzazione mirata del database (in particolare l'adozione della modalità WAL per SQLite).
Il risultato finale è un sistema che, non solo ha esplorato la possibilità di essere ottimizzato tramite la parallelizzazione, ma ci riesce offrendo le prestazioni superiori che in futuro potrebbero essere necessarie per sostenere le nuove sfide della ricerca scientifica.
Abstract
La gestione efficiente di grandi moli di dati rappresenta una delle sfide più critiche per la fisica delle alte energie moderna, in particolare in vista dell'imminente fase di High-Luminosity LHC, che comporterà un incremento esponenziale delle richieste di archiviazione e accesso.
Questo lavoro di tesi documenta l'evoluzione architetturale di StormTape, il servizio responsabile delle operazioni di staging da nastro magnetico presso il Tier-1 del CNAF-INFN. L'obiettivo primario del progetto è stato il superamento dei limiti di latenza imposti dalle precedenti implementazioni single-threaded, valutando l'adozione di paradigmi di programmazione concorrente offerti dallo standard C++20.
Per validare le prestazioni e la robustezza della nuova implementazione, è stata progettata e sviluppata una suite di load testing personalizzata basata sul framework Locust, capace di simulare pattern di traffico realistici e carichi intensivi.
L'analisi sperimentale ha condotto a risultati significativi e in parte controintuitivi. Sebbene il parallelismo offra vantaggi teorici, i test hanno evidenziato come l'interazione con filesystem distribuiti complessi (GPFS) in un contesto fortemente I/O bound possa introdurre instabilità se non gestita con estrema cautela. I benchmark dimostrano che l'incremento prestazionale più rilevante e stabile è stato ottenuto non attraverso la massimizzazione della concorrenza, bensì tramite l'ottimizzazione mirata del database (in particolare l'adozione della modalità WAL per SQLite).
Il risultato finale è un sistema che, non solo ha esplorato la possibilità di essere ottimizzato tramite la parallelizzazione, ma ci riesce offrendo le prestazioni superiori che in futuro potrebbero essere necessarie per sostenere le nuove sfide della ricerca scientifica.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Ruggieri, Angelo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
High-Luminosity LHC,StormTape,Tier-1 CNAF-INFN,Tape Staging,Programmazione Concorrente,Load Testing,Locust,Filesystem Distribuiti,GPFS,Ottimizzazione I/O,SQLite WAL
Data di discussione della Tesi
17 Dicembre 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Ruggieri, Angelo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
High-Luminosity LHC,StormTape,Tier-1 CNAF-INFN,Tape Staging,Programmazione Concorrente,Load Testing,Locust,Filesystem Distribuiti,GPFS,Ottimizzazione I/O,SQLite WAL
Data di discussione della Tesi
17 Dicembre 2025
URI
Statistica sui download
Gestione del documento: