Sistema Graph RAG per l’estrazione di informazioni tecniche da documentazione industriale: iperautomazione di un processo lavorativo completo

Magazzù, Gabriele (2025) Sistema Graph RAG per l’estrazione di informazioni tecniche da documentazione industriale: iperautomazione di un processo lavorativo completo. [Laurea magistrale], Università di Bologna, Corso di Studio in Informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Negli ultimi anni i Large Language Models (LLM) hanno rivoluzionato l'elaborazione del linguaggio naturale (NLP), con applicazioni in attività come traduzione automatica, sintesi testuale e question answering. Tuttavia, sono ancora soggetti ad alcuni limiti, come la generazione di contenuti non verificabili, l'assenza di conoscenze aggiornate e la scarsa abilità nel fornire risposte tracciabili e comprensibili. Per affrontare queste criticità, è stato introdotto il paradigma del Retrieval-Augmented Generation (RAG), che combina le capacità degli LLM con la possibilità di recuperare informazioni da basi di conoscenza esterne. In questo modo è possibile produrre risposte più pertinenti e affidabili. Il presente elaborato di tesi, sviluppato in collaborazione con Data Reply, propone la realizzazione di una sistema Graph RAG, per l'estrazione automatica di informazioni da documenti tecnici di gara, riguardanti macchinari industriali. Il sistema combina moduli di parsing e classificazione, la creazione di un indice gerarchico, la suddivisione del testo in chunk, il calcolo degli embeddings, il popolamento di una knowledge base su Neo4j Aura e fase di recupero via modelli LLM. Particolare attenzione è stata rivolta all'ottimizzazione, tramite un'analisi sperimentale comprendente una grid search per ricercare e selezionare la miglior metodologia di chunking e i relativi iperparametri, valutando tramite la metrica dell'automation rate. Vengono, dunque, esaminati i risultati. Poi, è proposta un'analisi comparativa con casi applicativi presenti in letteratura e con un'altra esperienza lavorativa. Infine, dopo aver esposto i possibili sviluppi futuri, vengono trattate le conclusioni dell'elaborato, le quali sostengono che il progetto sviluppato evidenzia la possibilità di riutilizzare il sistema in domini diversi con minime modifiche, rendendola una soluzione scalabile, modulare e di elevato valore aziendale per l'automazione di processi documentali complessi.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Magazzù, Gabriele
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM A: TECNICHE DEL SOFTWARE
Ordinamento Cds
DM270
Parole chiave
RAG,LLM,Knowledge Graph,Prompt Engineering,Hyperautomation
Data di discussione della Tesi
30 Ottobre 2025
URI

Altri metadati

Gestione del documento: Visualizza il documento

^