Classificazione e indice di qualità di immagini tramite Deep Learning

Ntronov, Kyrillos (2020) Classificazione e indice di qualità di immagini tramite Deep Learning. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Il Machine Learning sta acquistando sempre più importanza nelle realtà aziendali. Grazie all'utilizzo degli algoritmi di apprendimento automatico si riesce a costruire i sistemi "intelligenti" che analizzando i dati sono in grado di generare suggerimenti e predizioni rendendo possibile l'automatizzazione di alcuni task cognitivi che richiederebbero altrimenti un costo eccessivamente elevato di attività umana. Il progetto si è posto come l'obiettivo creare un servizio web da integrare nell'ecosistema aziendale in grado di analizzare le immagini in input per classificarle e dare una stima della qualità dell'immagine intesa come un punteggio approssimato di gradimento umano. Considerando il tipo di dato trattato, si è deciso di creare i modelli basati su Reti Neurali, in praticolare le architetture convoluzionari che sono particolarmente adatte ai problemi di visione artificiale. Lo scenario di classificazione affrontato nel progetto appartiene a un sottoinsieme dei problemi di classificzione detti "open-set" in quanto le immagini possibili in input non appartengono esclusivamente alle categorie definite, ma potrebbero appartenere a una categoria "universo" e in tal caso devono essere classificate come "Other". Per risolvere questo problema sono stati creati e confrontati alcuni metodi proposti in letteratura come threshold e classe negativa e una loro combinazione per una soluzione "ibrida". Per determinare l'architettura ottimale del sistema sono state confrontate diverse soluzioni, che includono un'architettura molto usata ResNet-50 che è poi stata utilizzata come base per i modelli del progetto, un'architettura "leggera" MobileNet e un modello di transfer learining che utilizza il classificatore SVM accoppiato alle feature estratte dalle immagini con la rete neurale pre-addestrata. Infine è stata sperimentata una rete Multi-Task che unisce i due compiti in un'unica architettura condivisa, con due output distinti.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Ntronov, Kyrillos
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
neural networks,machine learning,open set,classification,IQA
Data di discussione della Tesi
19 Novembre 2020
URI

Altri metadati

Gestione del documento: Visualizza il documento

^