Benincasa, Antonio
(2018)
Deep-learning per stima della confidenza di mappe depth.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
La stereo visione è una branca della visione artificiale che mira ad ottenere le informazioni tridimensionali perse durante il processo di acquisizione delle immagini. A tale scopo, viene utilizzata una coppia di camere sincronizzate e poste su una base orizzontale. Le immagini catturare simultaneamente vengono processate per recuperare le informazioni di profondità. Queste informazioni sono rappresentate da una mappa di disparità.
Nonostante sono state proposte un notevole numero di strategie per calcolare le informazioni tridimensionali, risultano ancora poco affidabili. Calcolare il grado di affidabilità di questi algoritmi è una fase cruciale e per questo, nel corso degli anni, sono stati proposti diversi benchmark per misurare l'effettiva efficacia degli algoritmi stereo. Questa valutazione viene chiamata misura di confidenza.
Le tecniche standard per calcolare le misure di confidenza analizzano, in generale, il cosiddetto volume dei costi che rappresenta il grado di dissimilarità/similarità per ogni assegnamento di disparità per ogni pixel dell'immagine di riferimento per il calcolo della mappa di disparità. Queste tecniche però risultano molto specifiche per problemi noti degli algoritmi stereo e quindi possono risultare migliori in determinate circostanze e decisamente peggiori in altre. Per questo motivo sono state studiate architetture di Machine Learning che calcolano le misure di confidenza molto più efficacemente rispetto alle tecniche standard.
In questo lavoro di tesi sono state studiate ed implementate reti convoluzionali profonde per il calcolo della misure di confidenza che non utilizzano il volume dei costi ma le mappe di disparità e,in alcuni casi, una delle due immagini che hanno generato tale mappa. Dopo aver valutato alcune tra le architetture migliori dello stato dell'arte, sono state progettate, implementate e valutate altre reti convoluzionali e confrontate con lo stato dell'arte.
Abstract
La stereo visione è una branca della visione artificiale che mira ad ottenere le informazioni tridimensionali perse durante il processo di acquisizione delle immagini. A tale scopo, viene utilizzata una coppia di camere sincronizzate e poste su una base orizzontale. Le immagini catturare simultaneamente vengono processate per recuperare le informazioni di profondità. Queste informazioni sono rappresentate da una mappa di disparità.
Nonostante sono state proposte un notevole numero di strategie per calcolare le informazioni tridimensionali, risultano ancora poco affidabili. Calcolare il grado di affidabilità di questi algoritmi è una fase cruciale e per questo, nel corso degli anni, sono stati proposti diversi benchmark per misurare l'effettiva efficacia degli algoritmi stereo. Questa valutazione viene chiamata misura di confidenza.
Le tecniche standard per calcolare le misure di confidenza analizzano, in generale, il cosiddetto volume dei costi che rappresenta il grado di dissimilarità/similarità per ogni assegnamento di disparità per ogni pixel dell'immagine di riferimento per il calcolo della mappa di disparità. Queste tecniche però risultano molto specifiche per problemi noti degli algoritmi stereo e quindi possono risultare migliori in determinate circostanze e decisamente peggiori in altre. Per questo motivo sono state studiate architetture di Machine Learning che calcolano le misure di confidenza molto più efficacemente rispetto alle tecniche standard.
In questo lavoro di tesi sono state studiate ed implementate reti convoluzionali profonde per il calcolo della misure di confidenza che non utilizzano il volume dei costi ma le mappe di disparità e,in alcuni casi, una delle due immagini che hanno generato tale mappa. Dopo aver valutato alcune tra le architetture migliori dello stato dell'arte, sono state progettate, implementate e valutate altre reti convoluzionali e confrontate con lo stato dell'arte.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Benincasa, Antonio
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Deep-learning,CNN,reti convoluzionali,apprendimento automatico,tensorflow,misura confidenza
Data di discussione della Tesi
15 Marzo 2018
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Benincasa, Antonio
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Deep-learning,CNN,reti convoluzionali,apprendimento automatico,tensorflow,misura confidenza
Data di discussione della Tesi
15 Marzo 2018
URI
Gestione del documento: