Estimation of depth and semantics by a CNN trained on computer-generated and real data

Zama Ramirez, Pierluigi (2017) Estimation of depth and semantics by a CNN trained on computer-generated and real data. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270], Documento ad accesso riservato.
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (5MB) | Contatta l'autore

Abstract

La “stima” o “estrazione” della profondità si riferisce ad un gruppo di tecniche che puntano ad ottenere una rappresentazione della struttura tridimensionale della scena, a partire da immagini bidimensionali. In altre parole, si ricerca la distanza dalla telecamera, per ogni punto appartenente alla scena vista. Con “segmentazione semantica” invece si intende l’insieme delle tecniche che come obbiettivo hanno la suddivisione dell’immagine in gruppi, dove ogni gruppo è composto da elementi della stessa classe. La tesi proposta punta ad affrontare in maniera congiunta le due questioni sopra citate attraverso l’utilizzo di una rete neurale convoluzionale, in particolare si avvale di una struttura detta Fully Convolutional Neural Network, all'interno dell’ambiente urbano. Data la scarsità di dataset di immagini con corrispettive ground truth di semantica e profondità scarseggiano, è stato creato un dataset sintetico a partire da un modello tridimensionale di una città, sviluppato tramite l’utilizzo del software Blender. La rete quindi viene prima allenata sui dati artificiali e in seguito viene eseguita un’operazione di rifinitura su un dataset di immagini reali, CityScapes. La rete così allenata ottiene buoni risultati in riferimento ad entrambi gli obbiettivi, riuscendo a raggiungere una buona accuratezza e un basso errore sia nella predizione della profondità che nella segmentazione semantica. Inoltre, la predizione contemporanea dei due risultati permette tempi di computazione minori rispetto all'esecuzione separata dei due processi, di predizione semantica e di profondità.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Zama Ramirez, Pierluigi
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
semantic segmentation,depth,disparity,cnn,blender,machine learning,computer vision,computer graphics
Data di discussione della Tesi
14 Marzo 2017
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^