SPARQL Event Processing Architecture: analisi e ottimizzazione delle prestazioni

Ferrari, Andrea (2021) SPARQL Event Processing Architecture: analisi e ottimizzazione delle prestazioni. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270]

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Condividi allo stesso modo 4.0 (CC BY-SA 4.0)
Download (6MB)

Abstract

Il SEPA (SPARQL Event Processing Architecture) si pone come middleware tra un endpoint SPARQL e i suoi clienti, offrendo vari servizi, in particolare la possibilità di registrarsi a delle sottoscrizioni. Il SEPA dunque implementa il design pattern publish-subscribe o anche chiamato Pub-Sub, che permette ai clienti di sottoscriversi designando il loro interesse a un certo sottoinsieme di conoscenza. In questo caso, il meccanismo di Pub-Sub si basa su richieste SPARQL dove ogni sottoscrizione indica l'interesse a quella parte della conoscenza che viene delimitata da una query SPARQL (query di sottoscrizione). Ogni pubblicazione degli aggiornamenti dei dati è rappresentata da una update SPARQL. Fornire questo servizio di sottoscrizioni, nel contesto semantico in cui il SEPA si pone, risulta molto costoso in termini prestazionali. L'obiettivo di questa tesi è quello di analizzare l'attuale meccanismo Pub-Sub, ricercare e implementare una prima parte di una possibile ottimizzazione per poi condurre ulteriori analisi, con lo scopo di realizzare un algoritmo che possa essere utilizzato per ottimizzare i tempi di gestione delle sottoscrizioni del SEPA, fornendo anche delle metriche sull'algoritmo stesso. Lo svolgimento dell'attività di tesi si può suddividere in quattro fasi. La prima fase è stata di studio sul SEPA e di approfondimento delle tecnologie coinvolte. Nella seconda fase è stato implementato un programma per eseguire dei benchmark in grado di valutare le attuali prestazioni del SEPA ed ottenere così i primi dati significativi sull'algoritmo nativo che gestisce le sottoscrizioni. La terza fase è stata un alternarsi tra studio, progettazione, implementazione e test sul nuovo algoritmo. La quarta e ultima fase si è occupata di riordinare i dati e consolidare il nuovo algoritmo. Al termine della tesi, i dati raccolti hanno confermato la validità dell'algoritmo, dimostrando come questo possa ridurre i tempi necessari alla gestione del meccanismo publish-subscribe.

Abstract

Tipologia del documento

Tesi di laurea (Laurea magistrale)

Autore della tesi

Ferrari, Andrea

Relatore della tesi

Roffia, Luca

Correlatore della tesi

Aguzzi, Cristiano

Scuola

Ingegneria e Architettura

Corso di studio