Gennari, Riccardo (2022) End-to-end Deep Metric Learning con Vision-Language Model per il Fashion Image Captioning. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena
Farinola, Francesco (2022) Graph-based Vision-Language Model for Multi-Modal Retrieval of Fashion Products. [Laurea magistrale], Università di Bologna, Corso di Studio in Artificial intelligence [LM-DM270], Documento full-text non disponibile