Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Negli ultimi anni la computer vision ha trovato numerose applicazioni nel mondo della moda, dalla segmentazione dei capi alla generazione automatica di outfit.
Tuttavia, la classificazione dello stile di un outfit rimane una sfida complessa e poco affrontata, per via della sua natura soggettiva e semantica.
Questa tesi propone un contributo in tale direzione, sviluppando AmbrogioAI: un sistema completo composto da backend e frontend, che consente all’utente di classificare un outfit come casual, sportivo o elegante, interagendo con due versioni del modello ResNet50 — una fornita da torchvision, l’altra implementata completamente da zero.
Il processo di sviluppo si `e articolato in quattro fasi sperimentali, con miglioramenti progressivi fino alla definizione di un’architettura personalizzabile. L’ultima fase ha introdotto un fine-tuning su immagini reali e una tecnica di addestramento con early stopping basato sulla metrica f1-score, che hanno portato a un miglioramento significativo delle prestazioni.
Il confronto tra le due implementazioni evidenzia come sia possibile realizzare un’implementazione completa di una rete neurale, senza appoggiarsi a librerie esistenti, ottenendo risultati comparabili a quelli delle librerie standard. Il lavoro si conclude con una riflessione sui limiti riscontrati e con proposte per future estensioni, tra cui l’integrazione in specchi intelligenti o assistenti vocali.
Abstract
Negli ultimi anni la computer vision ha trovato numerose applicazioni nel mondo della moda, dalla segmentazione dei capi alla generazione automatica di outfit.
Tuttavia, la classificazione dello stile di un outfit rimane una sfida complessa e poco affrontata, per via della sua natura soggettiva e semantica.
Questa tesi propone un contributo in tale direzione, sviluppando AmbrogioAI: un sistema completo composto da backend e frontend, che consente all’utente di classificare un outfit come casual, sportivo o elegante, interagendo con due versioni del modello ResNet50 — una fornita da torchvision, l’altra implementata completamente da zero.
Il processo di sviluppo si `e articolato in quattro fasi sperimentali, con miglioramenti progressivi fino alla definizione di un’architettura personalizzabile. L’ultima fase ha introdotto un fine-tuning su immagini reali e una tecnica di addestramento con early stopping basato sulla metrica f1-score, che hanno portato a un miglioramento significativo delle prestazioni.
Il confronto tra le due implementazioni evidenzia come sia possibile realizzare un’implementazione completa di una rete neurale, senza appoggiarsi a librerie esistenti, ottenendo risultati comparabili a quelli delle librerie standard. Il lavoro si conclude con una riflessione sui limiti riscontrati e con proposte per future estensioni, tra cui l’integrazione in specchi intelligenti o assistenti vocali.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Fattori, Fabio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Computer Vision,AI,Classificatore,Fashion,Moda,Vestiti,Client-Server,ReactJS
Data di discussione della Tesi
17 Luglio 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Fattori, Fabio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Computer Vision,AI,Classificatore,Fashion,Moda,Vestiti,Client-Server,ReactJS
Data di discussione della Tesi
17 Luglio 2025
URI
Gestione del documento: