Vitali, Luca
(2026)
Analisi comparativa delle performance di Small Language Models su dati strutturati in formato JSON e TOON.
[Laurea], Università di Bologna, Corso di Studio in
Ingegneria elettronica [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Questo elaborato si occupa dell'analisi delle performance degli Small Language Models (SLM) su dati strutturati nei formati JSON e TOON. Vengono presi in considerazione tre diversi modelli: Gemma 3 270M, Gemma 3 1B e Llama 3.2 3B, di cui si valutano le prestazioni in relazione alla tipologia di input elaborato. Lo studio prevede la creazione di un Benchmark per la generazione di dieci quesiti, che rimarranno invariati per tutti i test, e di dataset di diverse dimensioni dai quali i modelli devono estrarre le risposte. Il processo include l'interrogazione dei modelli, la valutazione della correttezza delle risposte generate e il calcolo della relativa accuratezza. Il Benchmark viene eseguito tramite simulazione Monte Carlo, metodologia che garantisce validità statistica e ripetibilità dei risultati nel tempo. Infine, vengono prodotti dei grafici per ciascun modello che mettono in relazione: accuratezza vs dimensione dataset confrontando il formato JSON con il TOON, numero di token vs dimensione dataset (considerando i due formati), e infine accuratezza vs numero di token (sempre considerando i due formati). Le conclusioni derivate dall'analisi dei grafici evidenziano le prestazioni dei modelli in rapporto alla dimensione e al formato dell'input elaborato.
Abstract
Questo elaborato si occupa dell'analisi delle performance degli Small Language Models (SLM) su dati strutturati nei formati JSON e TOON. Vengono presi in considerazione tre diversi modelli: Gemma 3 270M, Gemma 3 1B e Llama 3.2 3B, di cui si valutano le prestazioni in relazione alla tipologia di input elaborato. Lo studio prevede la creazione di un Benchmark per la generazione di dieci quesiti, che rimarranno invariati per tutti i test, e di dataset di diverse dimensioni dai quali i modelli devono estrarre le risposte. Il processo include l'interrogazione dei modelli, la valutazione della correttezza delle risposte generate e il calcolo della relativa accuratezza. Il Benchmark viene eseguito tramite simulazione Monte Carlo, metodologia che garantisce validità statistica e ripetibilità dei risultati nel tempo. Infine, vengono prodotti dei grafici per ciascun modello che mettono in relazione: accuratezza vs dimensione dataset confrontando il formato JSON con il TOON, numero di token vs dimensione dataset (considerando i due formati), e infine accuratezza vs numero di token (sempre considerando i due formati). Le conclusioni derivate dall'analisi dei grafici evidenziano le prestazioni dei modelli in rapporto alla dimensione e al formato dell'input elaborato.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Vitali, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Large,Language,Models,Small,JavaScript,Object,Notation,Token-Oriented,Gemma,Llama
Data di discussione della Tesi
12 Marzo 2026
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Vitali, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Large,Language,Models,Small,JavaScript,Object,Notation,Token-Oriented,Gemma,Llama
Data di discussione della Tesi
12 Marzo 2026
URI
Gestione del documento: