Lucioli, Luca
(2024)
Large Language Model per Dataset Giuridici Italiani: Esperimenti con Prompting, Retrieval-Augmented Generation e Fine-Tuning.
[Laurea], Università di Bologna, Corso di Studio in
Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Il NLP è uno dei settori dell'intelligenza artificiale che cattura maggiore interesse al giorno d'oggi. Negli ultimi anni abbiamo assistito alla crescita esponenziale delle capacità dei modelli di linguaggio e conseguentemente della loro diffusione. L'avvento dei modelli preaddestrati ha rivoluzionato il settore consentendo una vasta gamma di applicazioni in innumerevoli contesti.
Questa tesi affronta in particolare l'impiego del NLP nel dominio legale, un campo applicativo che rappresenta una della sfide maggiori per questi sistemi, essendo caratterizzato da un linguaggio molto complesso di cui è necessaria una conoscenza profonda.
Lo scopo di questo elaborato è quello di sperimentare e combinare diverse strategie come il prompting, il fine-tuning, la Retrieval-Augmented Generation (RAG) per migliorare le capacità di alcuni modelli di linguaggio nell'attività di question answering.
Abstract
Il NLP è uno dei settori dell'intelligenza artificiale che cattura maggiore interesse al giorno d'oggi. Negli ultimi anni abbiamo assistito alla crescita esponenziale delle capacità dei modelli di linguaggio e conseguentemente della loro diffusione. L'avvento dei modelli preaddestrati ha rivoluzionato il settore consentendo una vasta gamma di applicazioni in innumerevoli contesti.
Questa tesi affronta in particolare l'impiego del NLP nel dominio legale, un campo applicativo che rappresenta una della sfide maggiori per questi sistemi, essendo caratterizzato da un linguaggio molto complesso di cui è necessaria una conoscenza profonda.
Lo scopo di questo elaborato è quello di sperimentare e combinare diverse strategie come il prompting, il fine-tuning, la Retrieval-Augmented Generation (RAG) per migliorare le capacità di alcuni modelli di linguaggio nell'attività di question answering.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Lucioli, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Natural Language Processing,Transformer,Semantic Similarity Search,Giurisprudenza Italiana
Data di discussione della Tesi
15 Marzo 2024
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Lucioli, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Natural Language Processing,Transformer,Semantic Similarity Search,Giurisprudenza Italiana
Data di discussione della Tesi
15 Marzo 2024
URI
Gestione del documento: