STRUMENTI DI NAVIGAZIONE

Analisi e sviluppo di modelli per la classificazione di immagini in contesto open set nell’ambito di dispositivi embedded

Fiorini, Anna (2021) Analisi e sviluppo di modelli per la classificazione di immagini in contesto open set nell’ambito di dispositivi embedded. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270], Documento ad accesso riservato.

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (3MB) | Contatta l'autore

Abstract

L’obiettivo del mio progetto di tesi era quello di aggiungere una funzionalità all’interno del sensore di visione intelligente Smart-VS. Questo dispositivo è in grado di classificare l’oggetto in due classi, Good e No Good, sulla base del set di esempi forniti in fase di training, in ambito industriale è però difficile ottenere un set di campioni che comprenda tutte le situazioni possibili che potrebbero verificarsi. Lo scopo di questo progetto era perciò quello di progettare e implementare dei modelli che fossero in grado di rilevare la presenza di oggetti mai visti prima (Open set). La fase iniziale si è focalizzata sulla scelta dell’estrattore di features delle immagini. Alla fine, si sono utilizzati un descrittore di features ingegnerizzate e la VGG-16 pre-addestrata sul database ImageNet. La prima strategia è stata quella di creare un modello in grado di effettuare una tradizionale classificazione binaria per oggetti Good e No Good e inserire la fase di riconoscimento dell’Open set nella fase di inferenza. La seconda strategia si è focalizzata sull’utilizzo di modelli di Deep Metric Learning che sono in grado di imparare una trasformazione dallo spazio immagine allo spazio delle features, attribuendo alla distanza una misura di similarità semantica tra gli oggetti. In questo modo le classi Good e No Good risulteranno compatte mentre gli oggetti Open, semanticamente diversi, si troveranno lontani. Entrambe le strategie hanno prodotto risultati soddisfacenti, in particolare, nella prima categoria è stata creata una CNN che utilizza le features estratte dalla VGG-16 per eseguire il training per la classificazione binaria e che poi impiega il Classificatore con Processo Gaussiano per identificare gli oggetti Open che raggiunge un livello di accuracy sulle 3 classi del 99,44%. Mentre nella seconda categoria tra i modelli implementati il più performante è risultato essere la Rete Neurale Siamese con le features della VGG-16 che ottiene un accuracy del 99,3

Abstract

Tipologia del documento

Tesi di laurea (Laurea magistrale)

Autore della tesi

Fiorini, Anna

Relatore della tesi

Di Stefano, Luigi

Correlatore della tesi

Fiorini, Paolo

Scuola

Ingegneria e Architettura

Corso di studio