Stega, Alessandro Pio
(2019)
Sviluppo, implementazione e ottimizzazione di algoritmi per la scoperta di “outlier”.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Il lavoro oggetto dell'elaborato è incentrato sugli algoritmi di ricerca degli ouliers. In particolare, si è studiato l'algoritmo per il calcolo del solving set, grazie al quale è possibile trovare i top n outlier per un dataset e fornire un sottoinsieme, chiamato solving set, del dataset per predire se un oggetto si possa o meno classificare come un outlier. Il solving set, dunque, rappresenta un modello per i dati. In caso di arrivo di nuovi dati in generale il modello degrada nel tempo e pertanto è stata trovata un'euristica per individuare il momento in cui il modello si invalida e quali siano le soluzioni possibili. Inoltre, è stata proposta un'euristica per stimare il parametro n corrispondente al numero di top che si intende individuare.
Infine, è stata realizzata una libreria, con linguaggio Python, che implementa questo algoritmo.
Abstract
Il lavoro oggetto dell'elaborato è incentrato sugli algoritmi di ricerca degli ouliers. In particolare, si è studiato l'algoritmo per il calcolo del solving set, grazie al quale è possibile trovare i top n outlier per un dataset e fornire un sottoinsieme, chiamato solving set, del dataset per predire se un oggetto si possa o meno classificare come un outlier. Il solving set, dunque, rappresenta un modello per i dati. In caso di arrivo di nuovi dati in generale il modello degrada nel tempo e pertanto è stata trovata un'euristica per individuare il momento in cui il modello si invalida e quali siano le soluzioni possibili. Inoltre, è stata proposta un'euristica per stimare il parametro n corrispondente al numero di top che si intende individuare.
Infine, è stata realizzata una libreria, con linguaggio Python, che implementa questo algoritmo.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Stega, Alessandro Pio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
datamining,outlier,outlier prediction,outlier detection,solving set
Data di discussione della Tesi
14 Marzo 2019
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Stega, Alessandro Pio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
datamining,outlier,outlier prediction,outlier detection,solving set
Data di discussione della Tesi
14 Marzo 2019
URI
Gestione del documento: