Documenti full-text disponibili:
Abstract
Nell’ambito di analisi dei dati di traiettoria, le tecniche di clustering sono utilizzate con diversi obiettivi, dalla scoperta di strade ad alta percorrenza, predizione di destinazioni, fino allo studio del movimento. A seconda della tipologia, gli algoritmi di clustering si suddividono in: algoritmi basati sulla densità, algoritmi basati sul flusso, algoritmi basati sulla distanza.
Tra gli algoritmi di clustering basati su flussi di traiettorie, NEAT è tra i più recenti ed è sequenziale, tiene conto dei vincoli della rete stradale, della prossimità fra le strade e del flusso di movimento fra porzioni di strada consecutive, con l’obiettivo di individuare flussi di traffico ad alta densità, e significativi in termini di continuità di movimento, all'interno di una rete stradale.
Il contributo di questa tesi riguarda l’estensione in ambito big data di NEAT. L’estensione prodotta aggiunge la possibilità di eseguire clustering a diversi livelli di granularità, oltre ad eliminare il vincolo di dover conoscere la rete stradale a cui si riferiscono i dati e dover eseguire fasi di mapping delle traiettorie sulle strade. La struttura dell'algoritmo originario è stata modificata per ottenere un’implementazione dell’algoritmo e dell'estensione prodotta su una piattaforma big data, Apache Spark, al fine di eseguire clustering di traiettorie su un dataset formato da circa 295 milioni di ping gps.
Abstract
Nell’ambito di analisi dei dati di traiettoria, le tecniche di clustering sono utilizzate con diversi obiettivi, dalla scoperta di strade ad alta percorrenza, predizione di destinazioni, fino allo studio del movimento. A seconda della tipologia, gli algoritmi di clustering si suddividono in: algoritmi basati sulla densità, algoritmi basati sul flusso, algoritmi basati sulla distanza.
Tra gli algoritmi di clustering basati su flussi di traiettorie, NEAT è tra i più recenti ed è sequenziale, tiene conto dei vincoli della rete stradale, della prossimità fra le strade e del flusso di movimento fra porzioni di strada consecutive, con l’obiettivo di individuare flussi di traffico ad alta densità, e significativi in termini di continuità di movimento, all'interno di una rete stradale.
Il contributo di questa tesi riguarda l’estensione in ambito big data di NEAT. L’estensione prodotta aggiunge la possibilità di eseguire clustering a diversi livelli di granularità, oltre ad eliminare il vincolo di dover conoscere la rete stradale a cui si riferiscono i dati e dover eseguire fasi di mapping delle traiettorie sulle strade. La struttura dell'algoritmo originario è stata modificata per ottenere un’implementazione dell’algoritmo e dell'estensione prodotta su una piattaforma big data, Apache Spark, al fine di eseguire clustering di traiettorie su un dataset formato da circa 295 milioni di ping gps.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Oriani, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
trajectory clustering,trajectory mining,big data,spark
Data di discussione della Tesi
21 Marzo 2019
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Oriani, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
trajectory clustering,trajectory mining,big data,spark
Data di discussione della Tesi
21 Marzo 2019
URI
Statistica sui download
Gestione del documento: