Silvestri, Mattia
(2019)
Deep Reinforcement Learning for Combinatorial Optimization: Theoretical Frameworks and Experimental Developments.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
In questo lavoro di tesi, è stato utilizzato il Deep Q-learning, un algoritmo di Reinforcement Learning, per risolvere il Problema dell'Allocazione di Prodotti in un magazzino, un noto problema NP-hard.
I risultati sono sono stati confrontati con quelli ottenuti da una semplice euristica, da una meta-euristica proveniente dalla Ricerca Operativa e altri approcci basati sul Deep Reinforcement Learning. Nei test eseguiti, la meta-euristica ha individuato i risultati migliori ma l'approccio proposto in questa tesi ha ottenuto soluzioni ad essa molto vicine, e dimostrando di essere milgliore rispetto a gli altri metodi testati.
Abstract
In questo lavoro di tesi, è stato utilizzato il Deep Q-learning, un algoritmo di Reinforcement Learning, per risolvere il Problema dell'Allocazione di Prodotti in un magazzino, un noto problema NP-hard.
I risultati sono sono stati confrontati con quelli ottenuti da una semplice euristica, da una meta-euristica proveniente dalla Ricerca Operativa e altri approcci basati sul Deep Reinforcement Learning. Nei test eseguiti, la meta-euristica ha individuato i risultati migliori ma l'approccio proposto in questa tesi ha ottenuto soluzioni ad essa molto vicine, e dimostrando di essere milgliore rispetto a gli altri metodi testati.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Silvestri, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Reinforcement Learning,Deep Q-learning,Pointer Network,Product Allocation Problem,Combinatorial Optimization,Simulated Annealing
Data di discussione della Tesi
22 Luglio 2019
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Silvestri, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Reinforcement Learning,Deep Q-learning,Pointer Network,Product Allocation Problem,Combinatorial Optimization,Simulated Annealing
Data di discussione della Tesi
22 Luglio 2019
URI
Gestione del documento: