Carlucci, Francesco
(2026)
Evoluzione architetturale e migrazione tecnologica di un’applicazione web AI-based per la traduzione e l’analisi di testi in lingue classiche: il caso Teseo.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria e scienze informatiche [LM-DM270] - Cesena
Documenti full-text disponibili:
Abstract
Il presente lavoro di tesi documenta l'evoluzione architetturale e la migrazione tecnologica di Teseo, un'applicazione web basata su intelligenza artificiale per la traduzione e l'analisi di testi in latino e greco antico, sviluppata presso la startup Memoraiz. La piattaforma, con oltre centomila utenti registrati, offre traduzione assistita e analisi grammaticale strutturata attraverso l'utilizzo di Large Language Models.
L'architettura originale, basata su JavaScript, Firebase e OpenAI GPT-4o-mini, presentava limitazioni in termini di vendor lock-in, manutenibilità e qualità degli output AI. Il lavoro ha affrontato queste criticità attraverso una riprogettazione integrale: migrazione della codebase a TypeScript, adozione di Payload CMS come headless CMS, migrazione del database a PostgreSQL e deployment su AWS con pipeline CI/CD automatizzata.
Sul fronte AI, il sistema OCR è stato migrato a MistralAI, riducendo la latenza del 61% e raggiungendo un'accuratezza del 99% per il latino e del 96% per il greco. Il flusso di elaborazione è stato ristrutturato tramite il framework Mastra, con rilevamento automatico della lingua del testo inserito, esecuzione parallela di traduzione e analisi, e streaming progressivo dei risultati.
Infine, una valutazione su 13 modelli OpenAI ha guidato la selezione dei modelli da usare in produzione per ciascuno step del workflow, al fine di bilanciare qualità, latenza e costi.
Abstract
Il presente lavoro di tesi documenta l'evoluzione architetturale e la migrazione tecnologica di Teseo, un'applicazione web basata su intelligenza artificiale per la traduzione e l'analisi di testi in latino e greco antico, sviluppata presso la startup Memoraiz. La piattaforma, con oltre centomila utenti registrati, offre traduzione assistita e analisi grammaticale strutturata attraverso l'utilizzo di Large Language Models.
L'architettura originale, basata su JavaScript, Firebase e OpenAI GPT-4o-mini, presentava limitazioni in termini di vendor lock-in, manutenibilità e qualità degli output AI. Il lavoro ha affrontato queste criticità attraverso una riprogettazione integrale: migrazione della codebase a TypeScript, adozione di Payload CMS come headless CMS, migrazione del database a PostgreSQL e deployment su AWS con pipeline CI/CD automatizzata.
Sul fronte AI, il sistema OCR è stato migrato a MistralAI, riducendo la latenza del 61% e raggiungendo un'accuratezza del 99% per il latino e del 96% per il greco. Il flusso di elaborazione è stato ristrutturato tramite il framework Mastra, con rilevamento automatico della lingua del testo inserito, esecuzione parallela di traduzione e analisi, e streaming progressivo dei risultati.
Infine, una valutazione su 13 modelli OpenAI ha guidato la selezione dei modelli da usare in produzione per ciascuno step del workflow, al fine di bilanciare qualità, latenza e costi.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Carlucci, Francesco
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Teseo,Large Language Models,traduzione automatica,lingue classiche,latino,greco antico,applicazioni web AI-based,migrazione architetturale,TypeScript,Payload CMS,PostgreSQL,AWS,prompt engineering,Mastra,OCR,BLEU score,analisi
Data di discussione della Tesi
13 Marzo 2026
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Carlucci, Francesco
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Teseo,Large Language Models,traduzione automatica,lingue classiche,latino,greco antico,applicazioni web AI-based,migrazione architetturale,TypeScript,Payload CMS,PostgreSQL,AWS,prompt engineering,Mastra,OCR,BLEU score,analisi
Data di discussione della Tesi
13 Marzo 2026
URI
Statistica sui download
Gestione del documento: