Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Full-text non accessibile fino al 5 Marzo 2027.
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (2MB)
| Contatta l'autore
|
Abstract
L'algoritmo proposto in questa Tesi utilizza una sola videocamera, statica e calibrata, per la localizzazione 3D in tempo reale di persone in ambiente indoor: alla fine dell'elaborazione di ogni frame si vogliono ottenere le stime della posizione e del volume occupato da ciascuna persona inquadrata dalla videocamera tramite il parallelepipedo rettangolo minimo che la contiene. Per ottenerlo, è necessario stabilire un metodo di rappresentazione geometrica tridimensionale delle persone compatibile con il modello di proiezione a vista singola ottenuto dalla calibrazione. Il solido che meglio si presta a modellare una persona, visibile da una sola prospettiva, è il cilindro circolare.
I parametri di ogni cilindro devono essere trovati mediante i costrutti geometrici forniti dalla calibrazione, utili a convertire le coordinate "immagine" in coordinate "mondo".
La metodologia più compatibile con l'estrazione in tempo reale di feature significative sul piano immagine prevede l'utilizzo di algoritmi euristici, i quali però non consentono di associare immediatamente una semantica alle feature.
Estrazione, segmentazione e proiezione delle feature sono quindi i tre problemi principali da risolvere sequenzialmente in ogni frame per poter raggiungere il risultato finale. Per affrontarli, è stata utilizzata una pipeline in tre fasi che affina progressivamente i dati trattati al fine di trovare le rappresentazioni tridimensionali di persone a partire da semplici valori RGB di pixel.
In particolare, il metodo prevede una fase iniziale di selezione delle regioni significative dell’immagine, seguita dalla segmentazione bidimensionale delle persone e da una successiva ricostruzione 3D basata sui dati di calibrazione e su tecniche consolidate della geometria proiettiva.
Grazie a questo approccio, test estensivi dimostrano che è possibile stimare le bounding box 3D per ciascuna persona segmentata, operando nel rispetto dei vincoli di funzionamento in tempo reale.
Abstract
L'algoritmo proposto in questa Tesi utilizza una sola videocamera, statica e calibrata, per la localizzazione 3D in tempo reale di persone in ambiente indoor: alla fine dell'elaborazione di ogni frame si vogliono ottenere le stime della posizione e del volume occupato da ciascuna persona inquadrata dalla videocamera tramite il parallelepipedo rettangolo minimo che la contiene. Per ottenerlo, è necessario stabilire un metodo di rappresentazione geometrica tridimensionale delle persone compatibile con il modello di proiezione a vista singola ottenuto dalla calibrazione. Il solido che meglio si presta a modellare una persona, visibile da una sola prospettiva, è il cilindro circolare.
I parametri di ogni cilindro devono essere trovati mediante i costrutti geometrici forniti dalla calibrazione, utili a convertire le coordinate "immagine" in coordinate "mondo".
La metodologia più compatibile con l'estrazione in tempo reale di feature significative sul piano immagine prevede l'utilizzo di algoritmi euristici, i quali però non consentono di associare immediatamente una semantica alle feature.
Estrazione, segmentazione e proiezione delle feature sono quindi i tre problemi principali da risolvere sequenzialmente in ogni frame per poter raggiungere il risultato finale. Per affrontarli, è stata utilizzata una pipeline in tre fasi che affina progressivamente i dati trattati al fine di trovare le rappresentazioni tridimensionali di persone a partire da semplici valori RGB di pixel.
In particolare, il metodo prevede una fase iniziale di selezione delle regioni significative dell’immagine, seguita dalla segmentazione bidimensionale delle persone e da una successiva ricostruzione 3D basata sui dati di calibrazione e su tecniche consolidate della geometria proiettiva.
Grazie a questo approccio, test estensivi dimostrano che è possibile stimare le bounding box 3D per ciascuna persona segmentata, operando nel rispetto dei vincoli di funzionamento in tempo reale.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Ingargiola, Andrea
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
computer vision,image processing,computer vision 3D,geometria proiettiva,localizzazione 3D,people localization,people recognition
Data di discussione della Tesi
13 Marzo 2026
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Ingargiola, Andrea
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
computer vision,image processing,computer vision 3D,geometria proiettiva,localizzazione 3D,people localization,people recognition
Data di discussione della Tesi
13 Marzo 2026
URI
Gestione del documento: