Analisi della corsa tramite Image Synthesis e Human Pose Estimation

Avagnano, Marco (2024) Analisi della corsa tramite Image Synthesis e Human Pose Estimation. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [LM-DM270] - Cesena, Documento ad accesso riservato.
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Full-text non accessibile fino al 6 Marzo 2026.
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 4.0 (CC BY-NC-ND 4.0)

Download (3MB) | Contatta l'autore

Abstract

Negli ultimi anni, l'intelligenza artificiale si é evoluta in maniera esponenziale soprattutto nella branca della Computer Vision. In particolare sono nati metodi di Human Pose Estimation (HPE) in grado di analizzare un'immagine con all'interno una o più persone ed estrarre la posizione dei loro giunti (keypoints). La precisione di questi modelli dipende fortemente dalla qualità dell'immagine e la visibilità delle parti del corpo. In questo lavoro viene proposta un'analisi basata su immagini, della corsa di un atleta su tapis roulant, da cui si estraggono i keypoints tramite tecniche di HPE. L'attenzione è focalizzata sul fatto che le immagini catturate mostrano solo la parte inferiore del corpo dell'atleta. Questa limitazione è dovuta alla necessità di posizionare le attrezzature di registrazione da una distanza specifica dal tapis roulant. I modelli di HPE eseguiti su questo tipo di immagine mostrano in molti casi una scarsa accuratezza. Per risolvere questo problema viene proposto l'utilizzo di modelli generativi di immagine, Palette e Stable Diffusion Infinity, con l'obiettivo di generare la parte superiore del corpo per tentare di migliorare l'accuratezza dei modelli di HPE sui keypoints della parte bassa. Vengono adottati due differenti task generativi, inpainting e outpanting, che consentono di ricostruire l'immagine partendo da una maschera di rumore gaussiano. Nel corso del lavoro vengono proposti diversi esperimenti che mostrano l'aumento della precisione delle tecniche di HPE sulle immagini generate, un confronto fra i modelli a diffusione proposti e una breve valutazione della complessità computazionale del processo di generazione.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Avagnano, Marco
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Computer vision,Deep Learning,Human Pose Estimation,Image Synthesis,Generative AI
Data di discussione della Tesi
15 Marzo 2024
URI

Altri metadati

Gestione del documento: Visualizza il documento

^