Documenti full-text disponibili:
      
        
          
            ![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png)  | 
            
              
Documento PDF (Thesis)
   Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
 
              Download (1MB)
              
			  
			  
              
  
              
             | 
          
        
      
    
  
  
    
      Abstract
      Il Deep Reinforcement Learning acquista sempre più importanza tra gli algoritmi di apprendimento dopo i brillanti risultati ottenuti da DeepMind con AlphaGo e AlphaZero, rispettivamente riuscendo a battere il campione mondiale di Go (2015) e il chess engine Stockfish (2017). Negli ultimi anni sono stati sviluppati maggiormente programmi in grado di giocare a numerosi giochi Atari e, nell'ambito della robotica, di ottenere ottimi risultati nell’autoapprendimento di specifici comportamenti. Sebbene questa nuova tecnologia sia stata applicata con successo in questi ambiti, sono scarse le ricerche inerenti l'utilizzo del Deep Reinforcement Learning su problemi di ottimizzazione combinatorica. Questa tesi si pone l’obiettivo di esplorare una possibile soluzione al problema reale dell’allocazione di prodotti in un magazzino, confrontando i risultati ottenuti con la Ricerca Operativa e con l’allocazione dell’azienda presa in considerazione per comprenderne la bontà. Nel corso di questo lavoro verrà dapprima introdotto il Reinforcement Learning in generale e in  particolare il Q-learning. Successivamente verrà mostrato il Deep Reinforcement Learning, con un esempio applicandolo al gioco Catch. Infine sarà presentato il progetto e i risultati ottenuti del Deep Reinforcement Learning applicato avarie istanze del problema di allocazione di prodotti in magazzino.
     
    
      Abstract
      Il Deep Reinforcement Learning acquista sempre più importanza tra gli algoritmi di apprendimento dopo i brillanti risultati ottenuti da DeepMind con AlphaGo e AlphaZero, rispettivamente riuscendo a battere il campione mondiale di Go (2015) e il chess engine Stockfish (2017). Negli ultimi anni sono stati sviluppati maggiormente programmi in grado di giocare a numerosi giochi Atari e, nell'ambito della robotica, di ottenere ottimi risultati nell’autoapprendimento di specifici comportamenti. Sebbene questa nuova tecnologia sia stata applicata con successo in questi ambiti, sono scarse le ricerche inerenti l'utilizzo del Deep Reinforcement Learning su problemi di ottimizzazione combinatorica. Questa tesi si pone l’obiettivo di esplorare una possibile soluzione al problema reale dell’allocazione di prodotti in un magazzino, confrontando i risultati ottenuti con la Ricerca Operativa e con l’allocazione dell’azienda presa in considerazione per comprenderne la bontà. Nel corso di questo lavoro verrà dapprima introdotto il Reinforcement Learning in generale e in  particolare il Q-learning. Successivamente verrà mostrato il Deep Reinforcement Learning, con un esempio applicandolo al gioco Catch. Infine sarà presentato il progetto e i risultati ottenuti del Deep Reinforcement Learning applicato avarie istanze del problema di allocazione di prodotti in magazzino.
     
  
  
    
    
      Tipologia del documento
      Tesi di laurea
(Laurea)
      
      
      
      
        
      
        
          Autore della tesi
          Magnini, Matteo
          
        
      
        
          Relatore della tesi
          
          
        
      
        
          Correlatore della tesi
          
          
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
          Indirizzo
          Curriculum ingegneria informatica
          
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          machine learning,deep learning,reinforcement learning,combinatorial optimization,python,quadratic assignment problem,integer programming,keras
          
        
      
        
          Data di discussione della Tesi
          14 Dicembre 2018
          
        
      
      URI
      
      
     
   
  
    Altri metadati
    
      Tipologia del documento
      Tesi di laurea
(NON SPECIFICATO)
      
      
      
      
        
      
        
          Autore della tesi
          Magnini, Matteo
          
        
      
        
          Relatore della tesi
          
          
        
      
        
          Correlatore della tesi
          
          
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
          Indirizzo
          Curriculum ingegneria informatica
          
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          machine learning,deep learning,reinforcement learning,combinatorial optimization,python,quadratic assignment problem,integer programming,keras
          
        
      
        
          Data di discussione della Tesi
          14 Dicembre 2018
          
        
      
      URI
      
      
     
   
  
  
  
  
  
    
    Statistica sui download
    
    
  
  
    
      Gestione del documento: