STRUMENTI DI NAVIGAZIONE

Reinforcement Learning per robot grasping in ambiente Gym openAI

Tosi, Giammarco (2017) Reinforcement Learning per robot grasping in ambiente Gym openAI. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [LM-DM270] - Cesena

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 3.0 (CC BY-NC-ND 3.0)
Download (2MB)

Abstract

La teoria del Reinforcement Learning fornisce considerazioni formali, profondamente radicate nelle prospettive psicologiche e neuroscientifiche sul comportamento animale, di come gli agenti siano in grado di ottimizzare il loro controllo su un ambiente. In seguito allo studio dei metodi di Reinforcement Learning, l’obiettivo principale del lavoro di tesi è dimostrare che mediante gli stessi, un agente, servendosi di un braccio meccanico, è in grado di apprendere autonomamente come afferrare un oggetto. Al fine di conseguire l’obiettivo posto vengono realizzati gli ambienti di simulazione 2D robotArm, in diverse configurazioni, e due agenti: Q-Learning e Deep Q-Learning. Il primo agente implementa il metodo Q-Learning come proposto in letteratura con materializzazione della tabella per la stima della funzione valore, mentre il secondo sostituisce la tabella con una rete neurale volta all’approssimazione della funzione valore, la quale ha permesso l’utilizzo di una più dettagliata rappresentazione dello stato dell’ambiente. In seguito ai risultati ottenuti, viene dimostrato che mediante i metodi di Reinforcement Learning, un agente è in grado di apprendere in modo autonomo le dinamiche richieste per afferrare correttamente sia un oggetto in posizione statica che in movimento.

Abstract

Tipologia del documento

Tesi di laurea (Laurea magistrale)

Autore della tesi

Tosi, Giammarco

Relatore della tesi

Maltoni, Davide

Scuola

Ingegneria e Architettura

Corso di studio

Ingegneria e scienze informatiche [LM-DM270] - Cesena

Ordinamento Cds