Conversare con il bilancio di sostenibilità: estrazione e comprensione di dati da PDF tramite LLM, Data Visualization e chatbot

Sun, Jiekai (2025) Conversare con il bilancio di sostenibilità: estrazione e comprensione di dati da PDF tramite LLM, Data Visualization e chatbot. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

I bilanci di sostenibilità rappresentano uno strumento fondamentale per comunicare in modo trasparente le attività, gli impatti e i progressi di un’organizzazione rispetto a criteri ambientali, sociali ed economici. Tuttavia, la loro pubblicazione in formato PDF ne ostacola l’elaborazione digitale e limita il riuso dei dati a fini analitici e di ricerca. La presente tesi affronta il problema dell’estrazione di informazioni strutturate da documenti complessi, prendendo come caso di studio il Bilancio di Sostenibilità dell’Università di Bologna. Gli obiettivi della tesi includono la valutazione di strumenti esistenti per l’estrazione di dati, il confronto tra approcci tradizionali e modelli linguistici di grandi dimensioni (LLM), e lo sviluppo di una soluzione automatizzata capace di trasformare il contenuto del bilancio in dati strutturati. La strategia adottata si fonda su un approccio “divide et impera”, in cui modelli linguistici multimodali analizzano singolarmente le pagine del documento ed estraggono le informazioni rilevanti, successivamente integrate in un unico output. I dati così ottenuti vengono resi fruibili tramite un’applicazione multipiattaforma, che combina strumenti di data visualization e un chatbot interattivo in grado di guidare l’utente nell’esplorazione di tali contenuti. I risultati conseguiti dimostrano l’efficacia degli LLM nell’estrazione di informazioni da documenti complessi e offrono un punto di partenza per future applicazioni orientate alla gestione e comunicazione dei dati.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Sun, Jiekai
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
bilancio sostenibilità,estrazione dati,PDF,LLM,intelligenza artificiale,data visualization,chatbot
Data di discussione della Tesi
2 Ottobre 2025
URI

Altri metadati

Gestione del documento: Visualizza il documento

^