Localizzazione 3D in tempo reale di persone utilizzando singola vista statica

Ingargiola, Andrea (2026) Localizzazione 3D in tempo reale di persone utilizzando singola vista statica. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [LM-DM270] - Cesena, Documento ad accesso riservato.

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Full-text non accessibile fino al 5 Marzo 2027.
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (2MB) | Contatta l'autore

Abstract

L'algoritmo proposto in questa Tesi utilizza una sola videocamera, statica e calibrata, per la localizzazione 3D in tempo reale di persone in ambiente indoor: alla fine dell'elaborazione di ogni frame si vogliono ottenere le stime della posizione e del volume occupato da ciascuna persona inquadrata dalla videocamera tramite il parallelepipedo rettangolo minimo che la contiene. Per ottenerlo, è necessario stabilire un metodo di rappresentazione geometrica tridimensionale delle persone compatibile con il modello di proiezione a vista singola ottenuto dalla calibrazione. Il solido che meglio si presta a modellare una persona, visibile da una sola prospettiva, è il cilindro circolare. I parametri di ogni cilindro devono essere trovati mediante i costrutti geometrici forniti dalla calibrazione, utili a convertire le coordinate "immagine" in coordinate "mondo". La metodologia più compatibile con l'estrazione in tempo reale di feature significative sul piano immagine prevede l'utilizzo di algoritmi euristici, i quali però non consentono di associare immediatamente una semantica alle feature. Estrazione, segmentazione e proiezione delle feature sono quindi i tre problemi principali da risolvere sequenzialmente in ogni frame per poter raggiungere il risultato finale. Per affrontarli, è stata utilizzata una pipeline in tre fasi che affina progressivamente i dati trattati al fine di trovare le rappresentazioni tridimensionali di persone a partire da semplici valori RGB di pixel. In particolare, il metodo prevede una fase iniziale di selezione delle regioni significative dell’immagine, seguita dalla segmentazione bidimensionale delle persone e da una successiva ricostruzione 3D basata sui dati di calibrazione e su tecniche consolidate della geometria proiettiva. Grazie a questo approccio, test estensivi dimostrano che è possibile stimare le bounding box 3D per ciascuna persona segmentata, operando nel rispetto dei vincoli di funzionamento in tempo reale.

Abstract

Tipologia del documento

Tesi di laurea (Laurea magistrale)

Autore della tesi

Ingargiola, Andrea

Relatore della tesi

Bevilacqua, Alessandro

Scuola

Ingegneria e Architettura

Corso di studio

Ingegneria e scienze informatiche [LM-DM270] - Cesena

Ordinamento Cds