Coloretti, Pietro
(2025)
Image Enhancing e LLM Agent: Soluzioni di Intelligenza Artificiale per il Settore Tessile.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Il presente elaborato documenta lo sviluppo e l'implementazione di due servizi innovativi basati sull'Intelligenza Artificiale, realizzati per Logica s.r.l., un'azienda specializzata nello sviluppo di software per il settore tessile (PaintKnit). L'obiettivo della ricerca è stato duplice: elevare il fotorealismo dei contenuti digitali e automatizzare l'interazione uomo-macchina all'interno dei flussi di lavoro aziendali (uso del linguaggio naturale per compiere azioni sul software). Per il primo progetto, l'Image Enhancer, è stato adottato un approccio basato sui Latent Diffusion Models (LDM). Superati i limiti di stabilità e risoluzione delle architetture precedenti (GAN), la soluzione finale ha utilizzato il modello Juggernaut XL con ControlNet per garantire la massima fedeltà geometrica al fitting del capo originale. L'ottimizzazione tramite Tiled Diffusion ha permesso di trasformare i render ad alta risoluzione in immagini fotorealistiche, risolvendo il problema della qualità visiva in modo stabile ed efficiente. Parallelamente, il secondo progetto ha mirato a creare un Assistente Virtuale Intelligente. Il sistema si basa sull'architettura RAG (Retrieval-Augmented Generation) per fornire supporto tecnico sul manuale PaintKnit e su un'interfaccia dotata di Text-to-Speech (TTS) ottimizzato per la fluidità vocale. La funzionalità esecutiva, o Agente, è stata implementata tramite un sistema ibrido che aggira i vincoli infrastrutturali (client-based in Delphi). L'LLM, guidato da un rigoroso System Prompt, genera codice Python valido che viene poi eseguito da un modulo in Object Pascal/Delphi dell'applicazione locale, permettendo agli utenti di usare il linguaggio naturale per controllare l'applicazione ed eseguire azioni su di essa. Questo Agente Dual-Mode garantisce un'automazione stabile, sicurezza e un'efficace gestione del workflow aziendale. Il lavoro dimostra la possibilità di implementare soluzioni AI all'avanguardia in architetture software tradizionali.
Abstract
Il presente elaborato documenta lo sviluppo e l'implementazione di due servizi innovativi basati sull'Intelligenza Artificiale, realizzati per Logica s.r.l., un'azienda specializzata nello sviluppo di software per il settore tessile (PaintKnit). L'obiettivo della ricerca è stato duplice: elevare il fotorealismo dei contenuti digitali e automatizzare l'interazione uomo-macchina all'interno dei flussi di lavoro aziendali (uso del linguaggio naturale per compiere azioni sul software). Per il primo progetto, l'Image Enhancer, è stato adottato un approccio basato sui Latent Diffusion Models (LDM). Superati i limiti di stabilità e risoluzione delle architetture precedenti (GAN), la soluzione finale ha utilizzato il modello Juggernaut XL con ControlNet per garantire la massima fedeltà geometrica al fitting del capo originale. L'ottimizzazione tramite Tiled Diffusion ha permesso di trasformare i render ad alta risoluzione in immagini fotorealistiche, risolvendo il problema della qualità visiva in modo stabile ed efficiente. Parallelamente, il secondo progetto ha mirato a creare un Assistente Virtuale Intelligente. Il sistema si basa sull'architettura RAG (Retrieval-Augmented Generation) per fornire supporto tecnico sul manuale PaintKnit e su un'interfaccia dotata di Text-to-Speech (TTS) ottimizzato per la fluidità vocale. La funzionalità esecutiva, o Agente, è stata implementata tramite un sistema ibrido che aggira i vincoli infrastrutturali (client-based in Delphi). L'LLM, guidato da un rigoroso System Prompt, genera codice Python valido che viene poi eseguito da un modulo in Object Pascal/Delphi dell'applicazione locale, permettendo agli utenti di usare il linguaggio naturale per controllare l'applicazione ed eseguire azioni su di essa. Questo Agente Dual-Mode garantisce un'automazione stabile, sicurezza e un'efficace gestione del workflow aziendale. Il lavoro dimostra la possibilità di implementare soluzioni AI all'avanguardia in architetture software tradizionali.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Coloretti, Pietro
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM INGEGNERIA INFORMATICA
Ordinamento Cds
DM270
Parole chiave
Intelligenza Artificiale, Settore Tessile, Virtual Try-On, Image Enhancement, Stable Diffusion, LDM, ControlNet, Tiled Diffusion, LLM, Agente AI, RAG, Knowledge Base, Function Calling, Generazione di Codice, Delphi, Object Pascal, Gemini, GAN
Data di discussione della Tesi
4 Dicembre 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Coloretti, Pietro
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM INGEGNERIA INFORMATICA
Ordinamento Cds
DM270
Parole chiave
Intelligenza Artificiale, Settore Tessile, Virtual Try-On, Image Enhancement, Stable Diffusion, LDM, ControlNet, Tiled Diffusion, LLM, Agente AI, RAG, Knowledge Base, Function Calling, Generazione di Codice, Delphi, Object Pascal, Gemini, GAN
Data di discussione della Tesi
4 Dicembre 2025
URI
Gestione del documento: