![]() |
Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato Download (639kB) | Contatta l'autore |
![]() |
Documento PDF (Supplementary file)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato Download (294kB) | Contatta l'autore |
Abstract
L’analisi e l’ottimizzazione del codice rappresentano una sfida cruciale per i Large Language Models (LLM), nonostante il loro crescente utilizzo in ambiti complessi come la programmazione assistita e la rilevazione di vulnerabilità. Tecniche consolidate come il copy propagation e il constant folding, comunemente impiegate dai compilatori statici, si sono rivelate difficili da replicare per questi modelli, a causa della loro analisi probabilistica anzichè semantica. In questo studio, sono stati analizzati modelli come Code2Vec, GraphCodeBERT, LLaMA e ChatGPT-4 per valutare la loro capacità di identificare l’equivalenza funzionale tra algoritmi standard e perturbati, utilizzando un dataset progettato ad hoc. Nonostante l’applicazione di tecniche di prompt engineering abbia portato a miglioramenti nelle performance, i risultati mostrano che gli LLM non sono ancora strumenti affidabili per l’analisi e l’ottimizzazione del codice. Questo lavoro esplora le difficoltà incontrate dai modelli e propone possibili direzioni per future ricerche volte a colmare queste lacune.