Documenti full-text disponibili:
Abstract
Negli ultimi anni, i sistemi NoSQL si sono rivelati una soluzione efficace alle stringenti esigenze del web e dei sistemi di big data, grazie alle caratteristiche di scalabilità e flessibilità che superano le limitazioni imposte dai classici RDBMS.
La crescente popolarità è accompagnata però dalla mancanza di metodologie generali ed efficaci per la modellazione di dati, che permettano di sfruttare al meglio le possibilità offerte dal mondo non relazionale. Infatti, a differenza dei database relazionali, per cui esiste una vasta letteratura sul tema, molte tecniche di progettazione in ambito NoSQL sono proposte sotto forma di linee guida e best practice, per lo più dettate dall'esperienza, che spesso vanno adattate al carico di lavoro e alla specifica implementazione.
In questa tesi sono state analizzate le diverse strategie di modellazione in ambito NoSQL, evidenziando il ruolo fondamentale che hanno nel determinare le prestazioni finali del database.
L'analisi è stata effettuata utilizzando il benchmark TPC-C, su due popolari database NoSQL: MongoDB e Cassandra.
Inoltre, è stato progettato un indicatore che permette di avere un'approssimazione a priori delle prestazioni di una de-normalizzazione. L'indicatore si è dimostrato efficace per i database MongoDB e Cassandra nell'individuare le modellazioni dei dati ottimali per il carico di lavoro previsto.
Abstract
Negli ultimi anni, i sistemi NoSQL si sono rivelati una soluzione efficace alle stringenti esigenze del web e dei sistemi di big data, grazie alle caratteristiche di scalabilità e flessibilità che superano le limitazioni imposte dai classici RDBMS.
La crescente popolarità è accompagnata però dalla mancanza di metodologie generali ed efficaci per la modellazione di dati, che permettano di sfruttare al meglio le possibilità offerte dal mondo non relazionale. Infatti, a differenza dei database relazionali, per cui esiste una vasta letteratura sul tema, molte tecniche di progettazione in ambito NoSQL sono proposte sotto forma di linee guida e best practice, per lo più dettate dall'esperienza, che spesso vanno adattate al carico di lavoro e alla specifica implementazione.
In questa tesi sono state analizzate le diverse strategie di modellazione in ambito NoSQL, evidenziando il ruolo fondamentale che hanno nel determinare le prestazioni finali del database.
L'analisi è stata effettuata utilizzando il benchmark TPC-C, su due popolari database NoSQL: MongoDB e Cassandra.
Inoltre, è stato progettato un indicatore che permette di avere un'approssimazione a priori delle prestazioni di una de-normalizzazione. L'indicatore si è dimostrato efficace per i database MongoDB e Cassandra nell'individuare le modellazioni dei dati ottimali per il carico di lavoro previsto.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Salvatori, Riccardo
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
nosql,data modeling,benchmark,mongodb,cassandra,tpc-c
Data di discussione della Tesi
26 Marzo 2021
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Salvatori, Riccardo
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
nosql,data modeling,benchmark,mongodb,cassandra,tpc-c
Data di discussione della Tesi
26 Marzo 2021
URI
Statistica sui download
Gestione del documento: