Verso una migliore comprensione dei modelli linguistici di grandi dimensioni: Spiegabilità attraverso XAI

Verri, Alessandro (2024) Verso una migliore comprensione dei modelli linguistici di grandi dimensioni: Spiegabilità attraverso XAI. [Laurea], Università di Bologna, Corso di Studio in Informatica per il management [L-DM270]

Salva citazione

Documenti full-text disponibili:

Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Condividi allo stesso modo 4.0 (CC BY-SA 4.0)
Download (3MB)

Abstract

Negli ultimi anni, i Large Language Models (LLM) hanno raggiunto un livello di sofisticazione tale da produrre testi simili a quelli umani in una vasta gamma di contesti applicativi. Tuttavia, la natura opaca e la complessità intrinseca di questi modelli rendono difficile comprenderne il funzionamento interno, sollevando problemi di affidabilità, sicurezza ed etica. L’Explainable Artificial Intelligence (XAI) mira a rendere più trasparenti le “scatole nere” dell’AI, fornendo strumenti e tecniche per interpretare i risultati dei modelli. Questa tesi esplora l'efficacia di alcuni metodi di XAI, come LIME (Local Interpretable Model-agnostic Explanations) e Captum, applicandoli a LLM di piccole dimensioni. Attraverso esperimenti iniziali, come l’identificazione della capitale di una nazione, si è valutato quali parti del prompt risultano più significative per la predizione, confrontando la capacità esplicativa dei vari tool. I risultati mostrano che i metodi basati sulla perturbazione (LIME e Captum, Perturbation Based) forniscono spiegazioni più coerenti e interpretazioni più comprensibili rispetto ai metodi basati sul gradiente. Tuttavia, resta la necessità di ulteriori ricerche per affrontare limiti quali la complessità dei modelli di maggiori dimensioni, l'ottimizzazione della configurazione ottimale degli strumenti XAI e l’applicazione degli strumenti a prompt e task più complessi. In definitiva, questa tesi evidenzia come l’applicazione di tecniche XAI sugli LLM possa favorire una maggiore trasparenza e affidabilità, suggerendo possibili direzioni future per lo sviluppo di standard, benchmark e metodologie di testing più avanzati.

Abstract

Tipologia del documento

Tesi di laurea (Laurea)

Autore della tesi

Verri, Alessandro

Relatore della tesi

Evangelista, Davide

Scuola

Scienze

Corso di studio

Informatica per il management [L-DM270]

Ordinamento Cds