Antonelli, Giacomo
(2024)
creazione di un dataset legislativo e
sperimentazione di llm open source nel question
answering giuridico italiano.
[Laurea], Università di Bologna, Corso di Studio in
Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Questa tesi si inserisce nel contesto della legislazione italiana, proponendo l'utilizzo di tecnologie avanzate di Intelligenza Artificiale e di strumenti di scraping per la creazione di un dataset legale contenente, 721 quiz a tema legislativo e 98.929 articoli di leggi italiane. L’obiettivo principale è rendere disponibile un corpus di dati utile sia per l'addestramento di modelli AI sia come benchmark che per la valutazione di altri sistemi nel dominio legale. Inoltre, il lavoro include un'analisi statistica approfondita delle prestazioni di diverse architetture e modelli di linguaggio, addestrati per rispondere a domande legislative, l'analisi considera vari fattori, come la lingua utilizzata e il contesto fornito al modello.
Abstract
Questa tesi si inserisce nel contesto della legislazione italiana, proponendo l'utilizzo di tecnologie avanzate di Intelligenza Artificiale e di strumenti di scraping per la creazione di un dataset legale contenente, 721 quiz a tema legislativo e 98.929 articoli di leggi italiane. L’obiettivo principale è rendere disponibile un corpus di dati utile sia per l'addestramento di modelli AI sia come benchmark che per la valutazione di altri sistemi nel dominio legale. Inoltre, il lavoro include un'analisi statistica approfondita delle prestazioni di diverse architetture e modelli di linguaggio, addestrati per rispondere a domande legislative, l'analisi considera vari fattori, come la lingua utilizzata e il contesto fornito al modello.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Antonelli, Giacomo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Natural Language Processing,Machine Learning,Vector Database,Retrieval Augmented Generation,Python
Data di discussione della Tesi
28 Novembre 2024
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Antonelli, Giacomo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Natural Language Processing,Machine Learning,Vector Database,Retrieval Augmented Generation,Python
Data di discussione della Tesi
28 Novembre 2024
URI
Gestione del documento: