creazione di un dataset legislativo e sperimentazione di llm open source nel question answering giuridico italiano

Antonelli, Giacomo (2024) creazione di un dataset legislativo e sperimentazione di llm open source nel question answering giuridico italiano. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile

Salva citazione

Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Questa tesi si inserisce nel contesto della legislazione italiana, proponendo l'utilizzo di tecnologie avanzate di Intelligenza Artificiale e di strumenti di scraping per la creazione di un dataset legale contenente, 721 quiz a tema legislativo e 98.929 articoli di leggi italiane. L’obiettivo principale è rendere disponibile un corpus di dati utile sia per l'addestramento di modelli AI sia come benchmark che per la valutazione di altri sistemi nel dominio legale. Inoltre, il lavoro include un'analisi statistica approfondita delle prestazioni di diverse architetture e modelli di linguaggio, addestrati per rispondere a domande legislative, l'analisi considera vari fattori, come la lingua utilizzata e il contesto fornito al modello.

Abstract

Tipologia del documento

Tesi di laurea (Laurea)

Autore della tesi

Antonelli, Giacomo

Relatore della tesi

Moro, Gianluca

Correlatore della tesi

Molfetta, Lorenzo ; Casadei, Cristiano ; Italiani, Paolo

Scuola

Ingegneria e Architettura

Corso di studio