Integrazione di RAG e LLM nello Sviluppo del Software

Bollini, Simone (2025) Integrazione di RAG e LLM nello Sviluppo del Software. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento ad accesso riservato.

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (1MB) | Contatta l'autore

Abstract

I LLM addestrati per generare il codice sono oggi altamente efficaci e in grado di generare soluzioni di qualità. Tuttavia, poiché il loro addestramento si basa su dataset generici, tali modelli non sono in grado di elaborare soluzioni personalizzate per specifiche esigenze, utilizzando codice già creato dal programmatore o dalla propria azienda per contesti analoghi. Da questo nasce l'esigenza di addestrare il modello per personalizzare le soluzioni proposte, contestualizzandole alla propria realtà aziendale e al proprio stile nel programmare. Servirebbe quindi una nuova fase di fine-tuning per adattare il modello alle proprie esigenze, ma questa soluzione è un processo molto costoso che richiede particolari competenze tecniche difficilmente presenti in molte aziende. Inoltre il fine-tuning non permette di aggiornare il modello in maniera rapida e dinamica, richiedendo un nuovo addestramento per ogni modifica. Per rispondere a questa esigenza entra in gioco la RAG, che permette di aumentare la conoscenza del modello, recuperando informazioni da una propria base di conoscenza arricchendo il prompt della query di input che sarà elaborata dal LLM. Il RAG, ricercando semanticamente i chunk maggiormente somiglianti a quanto richiesto se trovati, li inserirà per aumentare il prompt del LLM, estendendo la base di informazioni sulla quale genererà l'output con la risposta. Questa tesi approfondisce questi concetti e sperimenta l'integrazione di un RAG specifico per codice Java e un LLM con lo scopo di ottenere risposte personalizzate che solo con la conoscenza del LLM, anche se estremamente performante e completo, sarebbero state impossibili da ottenere.

Abstract

Tipologia del documento

Tesi di laurea (Laurea)

Autore della tesi

Bollini, Simone

Relatore della tesi

Viroli, Mirko

Correlatore della tesi

Aguzzi, Gianluca

Scuola

Ingegneria e Architettura

Corso di studio