Mirabella, Roberto
(2024)
Ricerca mediante immagini e testo di asset 3D rappresentati come Neural Radiance Fields.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
La digitalizzazione delle scene tridimensionali è un campo ancora in fase di studio nell'ambito della Computer Vision. Ad oggi, uno degli approcci che sta riscuotendo un modesto successo, è rappresentato dai Neural Radiance Field (NeRF), per via delle loro capacità di ricostruzione accurate e veloci. Come già visto in nf2vec, è possibile sfruttare questa nuova tecnologia per applicazioni di deep learning con discreti risultati. Da qui è nata l’idea di creare un collegamento fra il mondo bidimensionale-testuale generato da CLIP, che è un modello di visione artificiale e linguaggio, e quello tridimensionale. L’obiettivo del presente lavoro di tesi, quindi, è quello di migliorare le capacità di retrieval da un database di scene tridimensionali sotto forma di NeRF. Nel dettaglio, si è sviluppata una rete, clip2nerf, capace di adattare il codice latente prodotto da CLIP nello spazio rappresentativo creato da nf2vec, in modo da semplificare l'individuazione e il recupero di NeRF.
Abstract
La digitalizzazione delle scene tridimensionali è un campo ancora in fase di studio nell'ambito della Computer Vision. Ad oggi, uno degli approcci che sta riscuotendo un modesto successo, è rappresentato dai Neural Radiance Field (NeRF), per via delle loro capacità di ricostruzione accurate e veloci. Come già visto in nf2vec, è possibile sfruttare questa nuova tecnologia per applicazioni di deep learning con discreti risultati. Da qui è nata l’idea di creare un collegamento fra il mondo bidimensionale-testuale generato da CLIP, che è un modello di visione artificiale e linguaggio, e quello tridimensionale. L’obiettivo del presente lavoro di tesi, quindi, è quello di migliorare le capacità di retrieval da un database di scene tridimensionali sotto forma di NeRF. Nel dettaglio, si è sviluppata una rete, clip2nerf, capace di adattare il codice latente prodotto da CLIP nello spazio rappresentativo creato da nf2vec, in modo da semplificare l'individuazione e il recupero di NeRF.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Mirabella, Roberto
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM INGEGNERIA INFORMATICA
Ordinamento Cds
DM270
Parole chiave
computer vision,deep learning,NeRF,retrieval,CLIP,feature transfer network
Data di discussione della Tesi
19 Marzo 2024
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Mirabella, Roberto
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM INGEGNERIA INFORMATICA
Ordinamento Cds
DM270
Parole chiave
computer vision,deep learning,NeRF,retrieval,CLIP,feature transfer network
Data di discussione della Tesi
19 Marzo 2024
URI
Gestione del documento: