Documenti full-text disponibili:
Abstract
Negli ultimi anni la diffusione massiva e pervasiva dei dispositivi di localizzazione ha portato a un aumento esponenziale della produzione di dati di traiettoria. Un numero crescente di applicazioni, in maniera più o meno diretta, raccoglie e memorizza dati relativi al posizionamento degli utenti che le utilizzano. Questi dati racchiudono un potere informativo enorme, che da un lato ha stimolato un forte sviluppo delle tecniche di analisi (si parla di trajectory data mining) ma dall'altro ha portato a una maggiore esposizione della privacy dei soggetti che producono i dati stessi. Attraverso un'analisi approfondita degli spostamenti di un soggetto è infatti possibile dedurre informazioni relative a comportamenti, abitudini e preferenze. Queste informazioni possono essere utilizzate per molteplici scopi, ad esempio fornire servizi personalizzati agli utenti di applicazioni, sistemi di recommendation, o per finalità commerciali. I dati di traiettoria hanno quindi anche un rilevante valore economico, ed è ormai noto che molte compagnie monetizzino dalla loro cessione: ciò ha attribuito ulteriore rilevanza al dibattito sulla privacy degli utenti. Spesso si tende ad anonimizzare i dati, sostituendo l'identità e i riferimenti degli utenti con identificatori randomici, ma la privacy degli utenti, anche in questi casi, non è inattaccabile. Sono state presentate numerose tecniche di de-anonimizzazione, volte ad attribuire vere e proprie identità ai soggetti trovando collegamenti con dati presenti in altre sorgenti. Gli studi evidenziano quindi la possibilità di violare la privacy degli utenti che producono i dati di traiettoria, trovando ad esempio collegamenti con profili personali di social network come Twitter o Facebook.
Questo lavoro di tesi in particolare è dedicato allo studio approfondito della letteratura riguardante le tecniche di de-anonimizzazione e all'applicazione concreta di algoritmi su un ampio dataset di traiettorie raccolte utilizzando dispositivi GPS.
Abstract
Negli ultimi anni la diffusione massiva e pervasiva dei dispositivi di localizzazione ha portato a un aumento esponenziale della produzione di dati di traiettoria. Un numero crescente di applicazioni, in maniera più o meno diretta, raccoglie e memorizza dati relativi al posizionamento degli utenti che le utilizzano. Questi dati racchiudono un potere informativo enorme, che da un lato ha stimolato un forte sviluppo delle tecniche di analisi (si parla di trajectory data mining) ma dall'altro ha portato a una maggiore esposizione della privacy dei soggetti che producono i dati stessi. Attraverso un'analisi approfondita degli spostamenti di un soggetto è infatti possibile dedurre informazioni relative a comportamenti, abitudini e preferenze. Queste informazioni possono essere utilizzate per molteplici scopi, ad esempio fornire servizi personalizzati agli utenti di applicazioni, sistemi di recommendation, o per finalità commerciali. I dati di traiettoria hanno quindi anche un rilevante valore economico, ed è ormai noto che molte compagnie monetizzino dalla loro cessione: ciò ha attribuito ulteriore rilevanza al dibattito sulla privacy degli utenti. Spesso si tende ad anonimizzare i dati, sostituendo l'identità e i riferimenti degli utenti con identificatori randomici, ma la privacy degli utenti, anche in questi casi, non è inattaccabile. Sono state presentate numerose tecniche di de-anonimizzazione, volte ad attribuire vere e proprie identità ai soggetti trovando collegamenti con dati presenti in altre sorgenti. Gli studi evidenziano quindi la possibilità di violare la privacy degli utenti che producono i dati di traiettoria, trovando ad esempio collegamenti con profili personali di social network come Twitter o Facebook.
Questo lavoro di tesi in particolare è dedicato allo studio approfondito della letteratura riguardante le tecniche di de-anonimizzazione e all'applicazione concreta di algoritmi su un ampio dataset di traiettorie raccolte utilizzando dispositivi GPS.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Santolini, Nicola
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
trajectory mining,de-anonimizzazione,privacy,social network
Data di discussione della Tesi
21 Marzo 2019
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Santolini, Nicola
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
trajectory mining,de-anonimizzazione,privacy,social network
Data di discussione della Tesi
21 Marzo 2019
URI
Statistica sui download
Gestione del documento: