Documenti full-text disponibili:
      
    
  
  
    
      Abstract
      Lo scopo principale di questa tesi è quello di voler mostrare un approccio per il riconoscimento di frodi bancarie. Vengono descritte e fornite soluzioni per diversi problemi, tra i quali la manipolazione di dataset con distribuzioni sbilanciate dei dati tra le classi. Vengono addestrati e testati diversi algoritmi di classificazione dimostrando come Random Forest e XGBoost siano gli approcci migliori. Un aspetto principale che permette di migliorare notevolmente i risultati ottenuti è quello di basare la classificazione sul comportamento degli utenti. Viene mostrato come sia possibile tramite un processo di feature engineering proporre nuovi attributi che permettano di catturare relazioni tra una transazione bancaria e le operazioni passate effettuate dallo stesso utente. Viene infine proposta l'implementazione di un prototipo basato su un'infrastruttura big data che possa analizzare streaming di dati.
     
    
      Abstract
      Lo scopo principale di questa tesi è quello di voler mostrare un approccio per il riconoscimento di frodi bancarie. Vengono descritte e fornite soluzioni per diversi problemi, tra i quali la manipolazione di dataset con distribuzioni sbilanciate dei dati tra le classi. Vengono addestrati e testati diversi algoritmi di classificazione dimostrando come Random Forest e XGBoost siano gli approcci migliori. Un aspetto principale che permette di migliorare notevolmente i risultati ottenuti è quello di basare la classificazione sul comportamento degli utenti. Viene mostrato come sia possibile tramite un processo di feature engineering proporre nuovi attributi che permettano di catturare relazioni tra una transazione bancaria e le operazioni passate effettuate dallo stesso utente. Viene infine proposta l'implementazione di un prototipo basato su un'infrastruttura big data che possa analizzare streaming di dati.
     
  
  
    
    
      Tipologia del documento
      Tesi di laurea
(Laurea magistrale)
      
      
      
      
        
      
        
          Autore della tesi
          Ravaglia, Alex
          
        
      
        
          Relatore della tesi
          
          
        
      
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          fraud detection,user behavior,feature engineering,data skew,machine learning,big data,streaming
          
        
      
        
          Data di discussione della Tesi
          26 Marzo 2021
          
        
      
      URI
      
      
     
   
  
    Altri metadati
    
      Tipologia del documento
      Tesi di laurea
(NON SPECIFICATO)
      
      
      
      
        
      
        
          Autore della tesi
          Ravaglia, Alex
          
        
      
        
          Relatore della tesi
          
          
        
      
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          fraud detection,user behavior,feature engineering,data skew,machine learning,big data,streaming
          
        
      
        
          Data di discussione della Tesi
          26 Marzo 2021
          
        
      
      URI
      
      
     
   
  
  
  
  
  
    
    Statistica sui download
    
    
  
  
    
      Gestione del documento: 
      
        