Documenti full-text disponibili:
Abstract
Lo scopo principale di questa tesi è quello di voler mostrare un approccio per il riconoscimento di frodi bancarie. Vengono descritte e fornite soluzioni per diversi problemi, tra i quali la manipolazione di dataset con distribuzioni sbilanciate dei dati tra le classi. Vengono addestrati e testati diversi algoritmi di classificazione dimostrando come Random Forest e XGBoost siano gli approcci migliori. Un aspetto principale che permette di migliorare notevolmente i risultati ottenuti è quello di basare la classificazione sul comportamento degli utenti. Viene mostrato come sia possibile tramite un processo di feature engineering proporre nuovi attributi che permettano di catturare relazioni tra una transazione bancaria e le operazioni passate effettuate dallo stesso utente. Viene infine proposta l'implementazione di un prototipo basato su un'infrastruttura big data che possa analizzare streaming di dati.
Abstract
Lo scopo principale di questa tesi è quello di voler mostrare un approccio per il riconoscimento di frodi bancarie. Vengono descritte e fornite soluzioni per diversi problemi, tra i quali la manipolazione di dataset con distribuzioni sbilanciate dei dati tra le classi. Vengono addestrati e testati diversi algoritmi di classificazione dimostrando come Random Forest e XGBoost siano gli approcci migliori. Un aspetto principale che permette di migliorare notevolmente i risultati ottenuti è quello di basare la classificazione sul comportamento degli utenti. Viene mostrato come sia possibile tramite un processo di feature engineering proporre nuovi attributi che permettano di catturare relazioni tra una transazione bancaria e le operazioni passate effettuate dallo stesso utente. Viene infine proposta l'implementazione di un prototipo basato su un'infrastruttura big data che possa analizzare streaming di dati.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Ravaglia, Alex
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
fraud detection,user behavior,feature engineering,data skew,machine learning,big data,streaming
Data di discussione della Tesi
26 Marzo 2021
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Ravaglia, Alex
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
fraud detection,user behavior,feature engineering,data skew,machine learning,big data,streaming
Data di discussione della Tesi
26 Marzo 2021
URI
Statistica sui download
Gestione del documento: