Autonomous Pricing using Policy-Gradient Reinforcement Learning

Frick, Kevin Michael (2022) Autonomous Pricing using Policy-Gradient Reinforcement Learning. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270]

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Condividi allo stesso modo 4.0 (CC BY-NC-SA 4.0)
Download (5MB)

Abstract

Nella letteratura economica e di teoria dei giochi vi è un dibattito aperto sulla possibilità di emergenza di comportamenti anticompetitivi da parte di algoritmi di determinazione automatica dei prezzi di mercato. L'obiettivo di questa tesi è sviluppare un modello di reinforcement learning di tipo actor-critic con entropy regularization per impostare i prezzi in un gioco dinamico di competizione oligopolistica con prezzi continui. Il modello che propongo esibisce in modo coerente comportamenti cooperativi supportati da meccanismi di punizione che scoraggiano la deviazione dall'equilibrio raggiunto a convergenza. Il comportamento di questo modello durante l'apprendimento e a convergenza avvenuta aiuta inoltre a interpretare le azioni compiute da Q-learning tabellare e altri algoritmi di prezzo in condizioni simili. I risultati sono robusti alla variazione del numero di agenti in competizione e al tipo di deviazione dall'equilibrio ottenuto a convergenza, punendo anche deviazioni a prezzi più alti.

Abstract

Tipologia del documento

Tesi di laurea (Laurea magistrale)

Autore della tesi

Frick, Kevin Michael

Relatore della tesi

Martello, Silvano

Correlatore della tesi

Denicolò, Vincenzo ; Pastorello, Sergio

Scuola

Ingegneria e Architettura

Corso di studio

Ingegneria informatica [LM-DM270]

Indirizzo

INFRASTRUCTURES AND APPLICATIONS FOR ADVANCED IT SYSTEMS

Ordinamento Cds

DM270

Parole chiave

reinforcement learning,computational economics,optimal control,policy gradient,deep learning,deep reinforcement learning,algorithmic collusion,multiagent reinforcement learning,marl,rl,drl,neural networks,learning,game theory

Data di discussione della Tesi

20 Luglio 2022

URI

https://amslaurea.unibo.it/id/eprint/26306

Altri metadati

Statistica sui download

Vedi altre statistiche

Gestione del documento:

Strumenti di navigazione

Collezioni AlmaDL

Autonomous Pricing using Policy-Gradient Reinforcement Learning

Abstract

Altri metadati

Statistica sui download