Analisi della corsa tramite Image Synthesis e Human Pose Estimation

Avagnano, Marco (2024) Analisi della corsa tramite Image Synthesis e Human Pose Estimation. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [LM-DM270] - Cesena

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 4.0 (CC BY-NC-ND 4.0)
Download (3MB)

Abstract

Negli ultimi anni, l'intelligenza artificiale si é evoluta in maniera esponenziale soprattutto nella branca della Computer Vision. In particolare sono nati metodi di Human Pose Estimation (HPE) in grado di analizzare un'immagine con all'interno una o più persone ed estrarre la posizione dei loro giunti (keypoints). La precisione di questi modelli dipende fortemente dalla qualità dell'immagine e la visibilità delle parti del corpo. In questo lavoro viene proposta un'analisi basata su immagini, della corsa di un atleta su tapis roulant, da cui si estraggono i keypoints tramite tecniche di HPE. L'attenzione è focalizzata sul fatto che le immagini catturate mostrano solo la parte inferiore del corpo dell'atleta. Questa limitazione è dovuta alla necessità di posizionare le attrezzature di registrazione da una distanza specifica dal tapis roulant. I modelli di HPE eseguiti su questo tipo di immagine mostrano in molti casi una scarsa accuratezza. Per risolvere questo problema viene proposto l'utilizzo di modelli generativi di immagine, Palette e Stable Diffusion Infinity, con l'obiettivo di generare la parte superiore del corpo per tentare di migliorare l'accuratezza dei modelli di HPE sui keypoints della parte bassa. Vengono adottati due differenti task generativi, inpainting e outpanting, che consentono di ricostruire l'immagine partendo da una maschera di rumore gaussiano. Nel corso del lavoro vengono proposti diversi esperimenti che mostrano l'aumento della precisione delle tecniche di HPE sulle immagini generate, un confronto fra i modelli a diffusione proposti e una breve valutazione della complessità computazionale del processo di generazione.

Abstract

Tipologia del documento

Tesi di laurea (Laurea magistrale)

Autore della tesi

Avagnano, Marco

Relatore della tesi

Borghi, Guido

Correlatore della tesi

Maltoni, Davide

Scuola

Ingegneria e Architettura

Corso di studio