Reinforcement Learning per robot grasping in ambiente Gym openAI

Tosi, Giammarco (2017) Reinforcement Learning per robot grasping in ambiente Gym openAI. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [LM-DM270] - Cesena
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0

Download (2MB)

Abstract

La teoria del Reinforcement Learning fornisce considerazioni formali, profondamente radicate nelle prospettive psicologiche e neuroscientifiche sul comportamento animale, di come gli agenti siano in grado di ottimizzare il loro controllo su un ambiente. In seguito allo studio dei metodi di Reinforcement Learning, l’obiettivo principale del lavoro di tesi è dimostrare che mediante gli stessi, un agente, servendosi di un braccio meccanico, è in grado di apprendere autonomamente come afferrare un oggetto. Al fine di conseguire l’obiettivo posto vengono realizzati gli ambienti di simulazione 2D robotArm, in diverse configurazioni, e due agenti: Q-Learning e Deep Q-Learning. Il primo agente implementa il metodo Q-Learning come proposto in letteratura con materializzazione della tabella per la stima della funzione valore, mentre il secondo sostituisce la tabella con una rete neurale volta all’approssimazione della funzione valore, la quale ha permesso l’utilizzo di una più dettagliata rappresentazione dello stato dell’ambiente. In seguito ai risultati ottenuti, viene dimostrato che mediante i metodi di Reinforcement Learning, un agente è in grado di apprendere in modo autonomo le dinamiche richieste per afferrare correttamente sia un oggetto in posizione statica che in movimento.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Tosi, Giammarco
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Reinforcement Learning,Q-Learning,Neural Network,Robot Grasping,Tensorflow,Python,OpenAI Gym,Box2D
Data di discussione della Tesi
16 Marzo 2017
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^