Documenti full-text disponibili:
Abstract
E' stata effettuata l'analisi del sistema HIVE su piattaforma Hadoop (installato su un cluster) e sfruttando il benchmark TPC-H ne sono stati valutati i tempi di esecuzione delle query modificando la size del database e il formato di memorizzazione dei file: si è utilizzato il formato standard (AVRO) di tipo sequenziale e il formato PARQUET che memorizza i dati per colonna invece che per riga.
Abstract
E' stata effettuata l'analisi del sistema HIVE su piattaforma Hadoop (installato su un cluster) e sfruttando il benchmark TPC-H ne sono stati valutati i tempi di esecuzione delle query modificando la size del database e il formato di memorizzazione dei file: si è utilizzato il formato standard (AVRO) di tipo sequenziale e il formato PARQUET che memorizza i dati per colonna invece che per riga.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Di Meo, Giovanni
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
HIVE, Hadoop, MapReduce, PARQUET, TPC-H, Benchmark, BigData, NoSQL
Data di discussione della Tesi
8 Ottobre 2015
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Di Meo, Giovanni
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
HIVE, Hadoop, MapReduce, PARQUET, TPC-H, Benchmark, BigData, NoSQL
Data di discussione della Tesi
8 Ottobre 2015
URI
Statistica sui download
Gestione del documento: