Documenti full-text disponibili:
Abstract
L'uomo è in grado di riconoscere e localizzare una moltitudine di oggetti in pochi istanti e con uno sforzo contenuto. Lo scopo della visione artificiale è quello di replicare questa intelligenza in modo da poterla portare in un sistema artificiale.
Il rilevamento di oggetti nella visione artificiale è la capacità di trovare un determinato oggetto in una sequenza di immagini o video. Solitamente per ottenere risultati significativi si utilizzano algoritmi che sfruttano il machine learning o il deep learning. Tuttavia queste tecniche di machine learning hanno i seguenti problemi: richiedono molto tempo per l'addestramento e sono troppo pesanti per piattaforme robotiche/embedded/mobile per poter permettere una localizzazione fluida (con un numero di frame per secondo accettabile).
L'obiettivo di questo elaborato di tesi è la progettazione e lo sviluppo di un sistema in grado di localizzare uno specifico oggetto in una sequenza di immagini o video in tempi soddisfacenti, in modo tale da poterlo utilizzare anche in tempo reale.
Tale sistema è proposto come evoluzione e sostituzione di quello attualmente utilizzato in CoRe50, dove viene utilizzata una finestra fissa in cui un utente umano deve necessariamente posizionarvi l'oggetto.
In questa tesi si approfondiranno i motivi che rendono la localizzazione di oggetti importante nella computer science, gli ambiti dove viene utilizzata, le metodologie che si possono adottare, i dispositivi che vengono impiegati per la raccolta delle immagini o dei video ed alcuni datasets utilizzati. Infine si esplorerà la soluzione adottata.
Abstract
L'uomo è in grado di riconoscere e localizzare una moltitudine di oggetti in pochi istanti e con uno sforzo contenuto. Lo scopo della visione artificiale è quello di replicare questa intelligenza in modo da poterla portare in un sistema artificiale.
Il rilevamento di oggetti nella visione artificiale è la capacità di trovare un determinato oggetto in una sequenza di immagini o video. Solitamente per ottenere risultati significativi si utilizzano algoritmi che sfruttano il machine learning o il deep learning. Tuttavia queste tecniche di machine learning hanno i seguenti problemi: richiedono molto tempo per l'addestramento e sono troppo pesanti per piattaforme robotiche/embedded/mobile per poter permettere una localizzazione fluida (con un numero di frame per secondo accettabile).
L'obiettivo di questo elaborato di tesi è la progettazione e lo sviluppo di un sistema in grado di localizzare uno specifico oggetto in una sequenza di immagini o video in tempi soddisfacenti, in modo tale da poterlo utilizzare anche in tempo reale.
Tale sistema è proposto come evoluzione e sostituzione di quello attualmente utilizzato in CoRe50, dove viene utilizzata una finestra fissa in cui un utente umano deve necessariamente posizionarvi l'oggetto.
In questa tesi si approfondiranno i motivi che rendono la localizzazione di oggetti importante nella computer science, gli ambiti dove viene utilizzata, le metodologie che si possono adottare, i dispositivi che vengono impiegati per la raccolta delle immagini o dei video ed alcuni datasets utilizzati. Infine si esplorerà la soluzione adottata.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Conti, Davide
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
localizzazione basata sulla profondità,localizzazione di oggetti,Machine Learning,visione artificiale,RealSense
Data di discussione della Tesi
19 Marzo 2020
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Conti, Davide
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
localizzazione basata sulla profondità,localizzazione di oggetti,Machine Learning,visione artificiale,RealSense
Data di discussione della Tesi
19 Marzo 2020
URI
Statistica sui download
Gestione del documento: