Progettazione e sviluppo di un chatbot basato su tecniche RAG per la divulgazione di informazioni sulle specie marine

Sonaglia, Miriam (2026) Progettazione e sviluppo di un chatbot basato su tecniche RAG per la divulgazione di informazioni sulle specie marine. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena
Documenti full-text disponibili:
[thumbnail of Thesis] Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Condividi allo stesso modo 4.0 (CC BY-SA 4.0)

Download (378kB)

Abstract

Il presente lavoro descrive la progettazione, l'implementazione e la valutazione comparativa di un chatbot basato su architettura Retrieval-Augmented Generation (RAG) per la divulgazione di informazioni sulle specie marine dei mari italiani, sviluppato nell'ambito dell'applicazione FinSpot. L'adozione dell'architettura RAG risponde alla necessità di vincolare le risposte del sistema a una base documentale verificata, al fine di ridurre il rischio di allucinazioni tipico dei modelli linguistici standalone. Il sistema è stato realizzato interamente in ambiente locale tramite LlamaIndex, Ollama, ChromaDB e Streamlit. Sono state sviluppate tre varianti del chatbot con diverse combinazioni di modelli di embedding e Large Language Model: nomic-embed-text con Phi-3 mini, mxbai-embed-large con Qwen 2.5, e mxbai-embed-large con Phi-3 mini. La valutazione è stata condotta su dieci domande di test attraverso cinque metriche pesate: tempo di risposta, aderenza documentale, identificazione della specie, completezza e gestione del contesto. La configurazione nomic-embed-text e Phi-3 mini si è rivelata la soluzione ottimale, dimostrando che configurazioni teoricamente superiori non garantiscono necessariamente i migliori risultati quando velocità e risorse computazionali costituiscono vincoli fondamentali.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Sonaglia, Miriam
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Retrieval-Augmented-Generation,RAG,Large Language Model,Chatbot,Embedding,Database vettoriale,Specie marine,Elaborazione linguaggio naturale,LLM,Phi-3 mini,Qwen 2.5,nomic-embed-text,mxbai-embed-large,ChromaDB,LlamaIndex,Ollama
Data di discussione della Tesi
13 Marzo 2026
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^