Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
I dati di traiettoria sono diventati sempre più diffusi con il progredire delle nuove tecnologie in grado di tracciare la posizione di varie entità. Questa categoria di dati comprende le tracce di mobilità generate da dispositivi e collegate tipicamente agli individui. Una traiettoria consiste in una serie di dati spazio-temporali rappresentanti il cambiamento di posizione di un dato utente nel tempo. Con l'esplosione delle tecnologie legate a questo tipo di dati, la ricerca ha permesso di utilizzare algoritmi di mining per estrapolare informazione utile da essi. Siccome questo tipo di dati possiede una natura sensibile dal punto di vista dell'informazione inferibile, si pone una problematica relativa alla privacy sulla pubblicazione di dataset di traiettoria. Vengono utilizzate tecniche di anonimizzazione per permettere di affrontare questa problematica. L'anonimizzazione porta tendenzialmente ad una più o meno grande perdita di informazione; obiettivo degli algoritmi che consentono di preservare la privacy nei dati è quello di mantenere alta la cosiddetta utilità dei dati, rispettando, allo stesso tempo, un dato principio di privacy. Tradizionalmente, la pubblicazione protetta di dataset avviene in maniera statica, ovvero vengono anonimizzate intere collezioni di dati in una sola volta. In un ambito big data, questa pratica risulta particolarmente inefficiente, a causa soprattutto dell'elevata dimensione dei dataset considerati. È possibile provvedere ad una pubblicazione protetta incrementale, per far fronte a questa problematica. L'obiettivo del lavoro presentato in questa tesi è l'analisi delle tecniche note in letteratura per effettuare questo tipo di operazione, con l'approfondimento di un algoritmo (ITSA) che consente l'anonimizzazione incrementale di stream di traiettorie con un metodo a sliding window. Questo si pone l'obiettivo di effettuare anonimizzazione incrementale minimizzando la distorsione nei dati protetti.
Abstract
I dati di traiettoria sono diventati sempre più diffusi con il progredire delle nuove tecnologie in grado di tracciare la posizione di varie entità. Questa categoria di dati comprende le tracce di mobilità generate da dispositivi e collegate tipicamente agli individui. Una traiettoria consiste in una serie di dati spazio-temporali rappresentanti il cambiamento di posizione di un dato utente nel tempo. Con l'esplosione delle tecnologie legate a questo tipo di dati, la ricerca ha permesso di utilizzare algoritmi di mining per estrapolare informazione utile da essi. Siccome questo tipo di dati possiede una natura sensibile dal punto di vista dell'informazione inferibile, si pone una problematica relativa alla privacy sulla pubblicazione di dataset di traiettoria. Vengono utilizzate tecniche di anonimizzazione per permettere di affrontare questa problematica. L'anonimizzazione porta tendenzialmente ad una più o meno grande perdita di informazione; obiettivo degli algoritmi che consentono di preservare la privacy nei dati è quello di mantenere alta la cosiddetta utilità dei dati, rispettando, allo stesso tempo, un dato principio di privacy. Tradizionalmente, la pubblicazione protetta di dataset avviene in maniera statica, ovvero vengono anonimizzate intere collezioni di dati in una sola volta. In un ambito big data, questa pratica risulta particolarmente inefficiente, a causa soprattutto dell'elevata dimensione dei dataset considerati. È possibile provvedere ad una pubblicazione protetta incrementale, per far fronte a questa problematica. L'obiettivo del lavoro presentato in questa tesi è l'analisi delle tecniche note in letteratura per effettuare questo tipo di operazione, con l'approfondimento di un algoritmo (ITSA) che consente l'anonimizzazione incrementale di stream di traiettorie con un metodo a sliding window. Questo si pone l'obiettivo di effettuare anonimizzazione incrementale minimizzando la distorsione nei dati protetti.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Semprini, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Privacy,Dati di Traiettoria,Anonimizzazione Incrementale
Data di discussione della Tesi
16 Luglio 2020
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Semprini, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Privacy,Dati di Traiettoria,Anonimizzazione Incrementale
Data di discussione della Tesi
16 Luglio 2020
URI
Gestione del documento: