Ferrari, Andrea
(2021)
SPARQL Event Processing Architecture: analisi e ottimizzazione delle prestazioni.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270]
Documenti full-text disponibili:
Abstract
Il SEPA (SPARQL Event Processing Architecture) si pone come middleware tra un endpoint SPARQL e i suoi clienti, offrendo vari servizi, in particolare la possibilità di registrarsi a delle sottoscrizioni.
Il SEPA dunque implementa il design pattern publish-subscribe o anche chiamato Pub-Sub, che permette ai clienti di sottoscriversi designando il loro interesse a un certo sottoinsieme di conoscenza. In questo caso, il meccanismo di Pub-Sub si basa su richieste SPARQL dove ogni sottoscrizione indica l'interesse a quella parte della conoscenza che viene delimitata da una query SPARQL (query di sottoscrizione).
Ogni pubblicazione degli aggiornamenti dei dati è rappresentata da una update SPARQL. Fornire questo servizio di sottoscrizioni, nel contesto semantico in cui il SEPA si pone, risulta molto costoso in termini prestazionali. L'obiettivo di questa tesi è quello di analizzare l'attuale meccanismo Pub-Sub, ricercare e implementare una prima parte di una possibile ottimizzazione per poi condurre ulteriori analisi, con lo scopo di realizzare un algoritmo che possa essere utilizzato per ottimizzare i tempi di gestione delle sottoscrizioni del SEPA, fornendo anche delle metriche sull'algoritmo stesso. Lo svolgimento dell'attività di tesi si può suddividere in quattro fasi. La prima fase è stata di studio sul SEPA e di approfondimento delle tecnologie coinvolte. Nella seconda fase è stato implementato un programma per eseguire dei benchmark in grado di valutare le attuali prestazioni del SEPA ed ottenere così i primi dati significativi sull'algoritmo nativo che gestisce le sottoscrizioni. La terza fase è stata un alternarsi tra studio, progettazione, implementazione e test sul nuovo algoritmo. La quarta e ultima fase si è occupata di riordinare i dati e consolidare il nuovo algoritmo. Al termine della tesi, i dati raccolti hanno confermato la validità dell'algoritmo, dimostrando come questo possa ridurre i tempi necessari alla gestione del meccanismo publish-subscribe.
Abstract
Il SEPA (SPARQL Event Processing Architecture) si pone come middleware tra un endpoint SPARQL e i suoi clienti, offrendo vari servizi, in particolare la possibilità di registrarsi a delle sottoscrizioni.
Il SEPA dunque implementa il design pattern publish-subscribe o anche chiamato Pub-Sub, che permette ai clienti di sottoscriversi designando il loro interesse a un certo sottoinsieme di conoscenza. In questo caso, il meccanismo di Pub-Sub si basa su richieste SPARQL dove ogni sottoscrizione indica l'interesse a quella parte della conoscenza che viene delimitata da una query SPARQL (query di sottoscrizione).
Ogni pubblicazione degli aggiornamenti dei dati è rappresentata da una update SPARQL. Fornire questo servizio di sottoscrizioni, nel contesto semantico in cui il SEPA si pone, risulta molto costoso in termini prestazionali. L'obiettivo di questa tesi è quello di analizzare l'attuale meccanismo Pub-Sub, ricercare e implementare una prima parte di una possibile ottimizzazione per poi condurre ulteriori analisi, con lo scopo di realizzare un algoritmo che possa essere utilizzato per ottimizzare i tempi di gestione delle sottoscrizioni del SEPA, fornendo anche delle metriche sull'algoritmo stesso. Lo svolgimento dell'attività di tesi si può suddividere in quattro fasi. La prima fase è stata di studio sul SEPA e di approfondimento delle tecnologie coinvolte. Nella seconda fase è stato implementato un programma per eseguire dei benchmark in grado di valutare le attuali prestazioni del SEPA ed ottenere così i primi dati significativi sull'algoritmo nativo che gestisce le sottoscrizioni. La terza fase è stata un alternarsi tra studio, progettazione, implementazione e test sul nuovo algoritmo. La quarta e ultima fase si è occupata di riordinare i dati e consolidare il nuovo algoritmo. Al termine della tesi, i dati raccolti hanno confermato la validità dell'algoritmo, dimostrando come questo possa ridurre i tempi necessari alla gestione del meccanismo publish-subscribe.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Ferrari, Andrea
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
SEPA,SPARQL Event Processing Architecture,SPARQL,analisi,ottimizzazione,RDF
Data di discussione della Tesi
11 Marzo 2021
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Ferrari, Andrea
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
SEPA,SPARQL Event Processing Architecture,SPARQL,analisi,ottimizzazione,RDF
Data di discussione della Tesi
11 Marzo 2021
URI
Statistica sui download
Gestione del documento: