Documenti full-text disponibili:
Abstract
Con l'avvento e il sempre più crescente impiego dei sistemi di intelligenza artificiale è stato possibile affrontare in modo nuovo molti problemi che da sempre hanno interessato vari ambiti dell'attività umana. Nell'ambito della visione artificiale, uno dei compiti per cui possono essere utilizzati modelli di intelligenza artificiale è il riconoscimento di volti all'interno di immagini o video. Per l'addestramento di questi modelli, tuttavia, sono necessarie grandissime quantità di dati e, sfruttando i tradizionali dataset reali si può incorrere in problematiche relative alla difficoltà di raccolta, alla scarsa variabilità o a restrizioni collegate alla privacy. In questo scenario stanno sempre di più emergendo dataset sintetici, i cui dati sono generati attraverso modelli di intelligenza artificiale generativa per replicare quelli del mondo reale. L'obiettivo di questa tesi è stato quindi generare, a partire dal dataset sintetico ONOT, contenente immagini raffiguranti persone di alta qualità e aderenti allo standard ISO/ICAO per l'uso in documenti leggibili elettronicamente, immagini modificate che ritraessero gli stessi soggetti con variazioni quali invecchiamento, aggiunta della barba, modifica dell'acconciatura, aggiunta di occhiali da vista o di un copricapo, modifiche alla pelle come tatuaggi o cicatrici. Le immagini originali e quelle modificate sono state poi usate per generare video sintetici e costruire così VAMONOT, un dataset sintetico di alta qualità che permetta l'addestramento di modelli incentrati sul riconoscimento di volti in sequenze video.
Abstract
Con l'avvento e il sempre più crescente impiego dei sistemi di intelligenza artificiale è stato possibile affrontare in modo nuovo molti problemi che da sempre hanno interessato vari ambiti dell'attività umana. Nell'ambito della visione artificiale, uno dei compiti per cui possono essere utilizzati modelli di intelligenza artificiale è il riconoscimento di volti all'interno di immagini o video. Per l'addestramento di questi modelli, tuttavia, sono necessarie grandissime quantità di dati e, sfruttando i tradizionali dataset reali si può incorrere in problematiche relative alla difficoltà di raccolta, alla scarsa variabilità o a restrizioni collegate alla privacy. In questo scenario stanno sempre di più emergendo dataset sintetici, i cui dati sono generati attraverso modelli di intelligenza artificiale generativa per replicare quelli del mondo reale. L'obiettivo di questa tesi è stato quindi generare, a partire dal dataset sintetico ONOT, contenente immagini raffiguranti persone di alta qualità e aderenti allo standard ISO/ICAO per l'uso in documenti leggibili elettronicamente, immagini modificate che ritraessero gli stessi soggetti con variazioni quali invecchiamento, aggiunta della barba, modifica dell'acconciatura, aggiunta di occhiali da vista o di un copricapo, modifiche alla pelle come tatuaggi o cicatrici. Le immagini originali e quelle modificate sono state poi usate per generare video sintetici e costruire così VAMONOT, un dataset sintetico di alta qualità che permetta l'addestramento di modelli incentrati sul riconoscimento di volti in sequenze video.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Penserini, Nicolò
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
dataset,video,immagini,volti,IA,realismo,sintetici
Data di discussione della Tesi
27 Novembre 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Penserini, Nicolò
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
dataset,video,immagini,volti,IA,realismo,sintetici
Data di discussione della Tesi
27 Novembre 2025
URI
Gestione del documento: