Tosoroni, Anna
(2025)
Tecniche di Prompting di Large Language Model per il Word Sense Disambiguation.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Informatica [LM-DM270]
Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (809kB)
|
Abstract
Il Word Sense Disambiguation (WSD) rappresenta una sfida cruciale nel Natural Language Processing, volta a determinare il significato corretto di una parola target in base al contesto. Con l’avvento dei Large Language Models il panorama del WSD è stato completamente rivoluzionato, ma il loro impiego in quest’ambito rimane ancora complesso, richiedendo specifiche e onerose fasi
di fine-tuning su corpora annotati. Questo studio analizza le capacità di disambiguazione di LLMs open-source della famiglia LLaMA, sfruttando esclusivamente tecniche di Prompt Inference. L’obiettivo è valutare come LLMs di piccole dimensioni riescano a interpretare e distinguere i diversi significati delle parole attraverso prompt accuratamente progettati. Partendo dal Zero-
Shot prompting, vengono introdotti progressivamente approcci più sofisticati, inducendo i modelli a ragionamenti sempre più espliciti. Per parole di difficile disambiguazione, per via di molteplici significati possibili, viene adottato il CoT-Verified prompting, un metodo in cui il modello riesamina le proprie previsioni. Dopo una prima analisi con CoT prompting, le parole associate a previsioni errate vengono riconsiderate attraverso un prompt di verifica che ne richiede la conferma o la correzione. I prompt più efficaci sono stati testati sui dataset che compongono il Unified Evaluation Framework, benchmark di riferimento nella valutazione dei sistemi di WSD. I risultati dimostrano come anche LLM di dimensioni ridotte possano ottenere prestazioni competitive, superando
alcuni dei modelli che compongono l’attuale stato dell’arte nel Word Sense Disambiguation.
Abstract
Il Word Sense Disambiguation (WSD) rappresenta una sfida cruciale nel Natural Language Processing, volta a determinare il significato corretto di una parola target in base al contesto. Con l’avvento dei Large Language Models il panorama del WSD è stato completamente rivoluzionato, ma il loro impiego in quest’ambito rimane ancora complesso, richiedendo specifiche e onerose fasi
di fine-tuning su corpora annotati. Questo studio analizza le capacità di disambiguazione di LLMs open-source della famiglia LLaMA, sfruttando esclusivamente tecniche di Prompt Inference. L’obiettivo è valutare come LLMs di piccole dimensioni riescano a interpretare e distinguere i diversi significati delle parole attraverso prompt accuratamente progettati. Partendo dal Zero-
Shot prompting, vengono introdotti progressivamente approcci più sofisticati, inducendo i modelli a ragionamenti sempre più espliciti. Per parole di difficile disambiguazione, per via di molteplici significati possibili, viene adottato il CoT-Verified prompting, un metodo in cui il modello riesamina le proprie previsioni. Dopo una prima analisi con CoT prompting, le parole associate a previsioni errate vengono riconsiderate attraverso un prompt di verifica che ne richiede la conferma o la correzione. I prompt più efficaci sono stati testati sui dataset che compongono il Unified Evaluation Framework, benchmark di riferimento nella valutazione dei sistemi di WSD. I risultati dimostrano come anche LLM di dimensioni ridotte possano ottenere prestazioni competitive, superando
alcuni dei modelli che compongono l’attuale stato dell’arte nel Word Sense Disambiguation.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Tosoroni, Anna
Relatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM A: TECNICHE DEL SOFTWARE
Ordinamento Cds
DM270
Parole chiave
Word Sense Disambiguation,Large Language Model,Prompt Engineering,LLM Inference,Chain of Thought prompting
Data di discussione della Tesi
27 Marzo 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Tosoroni, Anna
Relatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM A: TECNICHE DEL SOFTWARE
Ordinamento Cds
DM270
Parole chiave
Word Sense Disambiguation,Large Language Model,Prompt Engineering,LLM Inference,Chain of Thought prompting
Data di discussione della Tesi
27 Marzo 2025
URI
Statistica sui download
Gestione del documento: