Autonomous Pricing using Policy-Gradient Reinforcement Learning

Frick, Kevin Michael (2022) Autonomous Pricing using Policy-Gradient Reinforcement Learning. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270]
Documenti full-text disponibili:
[thumbnail of Thesis] Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Condividi allo stesso modo 4.0 (CC BY-NC-SA 4.0)

Download (5MB)

Abstract

Nella letteratura economica e di teoria dei giochi vi è un dibattito aperto sulla possibilità di emergenza di comportamenti anticompetitivi da parte di algoritmi di determinazione automatica dei prezzi di mercato. L'obiettivo di questa tesi è sviluppare un modello di reinforcement learning di tipo actor-critic con entropy regularization per impostare i prezzi in un gioco dinamico di competizione oligopolistica con prezzi continui. Il modello che propongo esibisce in modo coerente comportamenti cooperativi supportati da meccanismi di punizione che scoraggiano la deviazione dall'equilibrio raggiunto a convergenza. Il comportamento di questo modello durante l'apprendimento e a convergenza avvenuta aiuta inoltre a interpretare le azioni compiute da Q-learning tabellare e altri algoritmi di prezzo in condizioni simili. I risultati sono robusti alla variazione del numero di agenti in competizione e al tipo di deviazione dall'equilibrio ottenuto a convergenza, punendo anche deviazioni a prezzi più alti.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Frick, Kevin Michael
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
INFRASTRUCTURES AND APPLICATIONS FOR ADVANCED IT SYSTEMS
Ordinamento Cds
DM270
Parole chiave
reinforcement learning,computational economics,optimal control,policy gradient,deep learning,deep reinforcement learning,algorithmic collusion,multiagent reinforcement learning,marl,rl,drl,neural networks,learning,game theory
Data di discussione della Tesi
20 Luglio 2022
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^