Campanale, Rossella
(2025)
Llama 3.2 e 3.3 nel contesto della traduzione nelle istituzioni dell’Unione europea: task di automatic post-editing ed error recognition.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Specialized translation [LM-DM270] - Forli', Documento ad accesso riservato.
Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (1MB)
| Contatta l'autore
|
Abstract
Tra i fondamenti principali dell'Unione europea spicca il multilinguismo, garantito dalla Direzione generale della Traduzione che assicura l'accessibilità dei documenti ufficiali e delle comunicazioni in tutte le lingue degli Stati membri. L'innovazione delle tecnologie linguistiche e in particolare gli avanzamenti nelle capacità traduttive dei Large Language Models aprono nuove prospettive a supporto dell'efficienza nei processi traduttivi. Questa tesi analizza il contributo dei LLM Llama 3.2 e 3.3 a supporto della fase di revisione, in particolare attraverso task di automatic post-editing ed error recognition. I due modelli sono stati testati su un dataset costituito da singole frasi contenenti errori di diverse tipologie e valutati in base alla qualità delle correzioni, la coerenza del reasoning e la capacità di attenersi a specifiche linee guida stilistiche e terminologiche. Inoltre, sono state sperimentate variazioni linguistiche e nel livello di dettaglio dei prompt utilizzati. Llama 3.3 ha presentato costanti miglioramenti rispetto alla versione precedente, dimostrando maggiore accuratezza nella risoluzione e identificazione degli errori. Tuttavia, le performance dei modelli variano a seconda della tipologia di errore e presentano problematiche come fenomeni di allucinazione e incoerenze nel reasoning. Questa tesi rappresenta un contributo alla ricerca sulle tecniche di automatic post-editing attraverso i LLM evidenziandone il potenziale applicativo nel contesto istituzionale e la necessità di perfezionamento delle tecniche di prompting e fine-tuning al fine di raggiungere gli standard qualitativi richiesti e minimizzare interferenze e imprecisioni.
Abstract
Tra i fondamenti principali dell'Unione europea spicca il multilinguismo, garantito dalla Direzione generale della Traduzione che assicura l'accessibilità dei documenti ufficiali e delle comunicazioni in tutte le lingue degli Stati membri. L'innovazione delle tecnologie linguistiche e in particolare gli avanzamenti nelle capacità traduttive dei Large Language Models aprono nuove prospettive a supporto dell'efficienza nei processi traduttivi. Questa tesi analizza il contributo dei LLM Llama 3.2 e 3.3 a supporto della fase di revisione, in particolare attraverso task di automatic post-editing ed error recognition. I due modelli sono stati testati su un dataset costituito da singole frasi contenenti errori di diverse tipologie e valutati in base alla qualità delle correzioni, la coerenza del reasoning e la capacità di attenersi a specifiche linee guida stilistiche e terminologiche. Inoltre, sono state sperimentate variazioni linguistiche e nel livello di dettaglio dei prompt utilizzati. Llama 3.3 ha presentato costanti miglioramenti rispetto alla versione precedente, dimostrando maggiore accuratezza nella risoluzione e identificazione degli errori. Tuttavia, le performance dei modelli variano a seconda della tipologia di errore e presentano problematiche come fenomeni di allucinazione e incoerenze nel reasoning. Questa tesi rappresenta un contributo alla ricerca sulle tecniche di automatic post-editing attraverso i LLM evidenziandone il potenziale applicativo nel contesto istituzionale e la necessità di perfezionamento delle tecniche di prompting e fine-tuning al fine di raggiungere gli standard qualitativi richiesti e minimizzare interferenze e imprecisioni.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Campanale, Rossella
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM TRANSLATION AND TECHNOLOGY
Ordinamento Cds
DM270
Parole chiave
automatic post-editing,LLM,error recognition,traduzione,unione europea,post-editing
Data di discussione della Tesi
18 Marzo 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Campanale, Rossella
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM TRANSLATION AND TECHNOLOGY
Ordinamento Cds
DM270
Parole chiave
automatic post-editing,LLM,error recognition,traduzione,unione europea,post-editing
Data di discussione della Tesi
18 Marzo 2025
URI
Statistica sui download
Gestione del documento: