Evoluzione delle Tecniche di Intelligenza Artificiale nel Riconoscimento Ottico dei Caratteri: Dalla Pattern Recognition ai Modelli di Deep Learning

Di Varano, Lorenzo (2026) Evoluzione delle Tecniche di Intelligenza Artificiale nel Riconoscimento Ottico dei Caratteri: Dalla Pattern Recognition ai Modelli di Deep Learning. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

L'elaborato analizza l'evoluzione tecnologica del Riconoscimento Ottico dei Caratteri (OCR), tracciando un percorso che muove dai primi dispositivi elettromeccanici della fine del XIX secolo fino alle più recenti architetture basate sui Transformer. La ricerca documenta la transizione paradigmatica dalla Pattern Recognition tradizionale, caratterizzata da euristiche progettate manualmente e pipeline rigide di pre-processing e segmentazione, verso i moderni sistemi di Deep Learning. Vengono inizialmente esaminati i limiti degli approcci classici, come il template matching e l'analisi strutturale, evidenziandone la fragilità di fronte alla variabilità tipografica (omni-font) e al rumore visivo. Successivamente, la tesi approfondisce l'impatto delle Reti Neurali Convoluzionali (CNN), analizzando modelli storici come LeNet-5 e architetture moderne quali ResNet e MobileNet, capaci di estrarre automaticamente le caratteristiche visive direttamente dai pixel. Un focus particolare è dedicato al superamento del "paradosso di Sayre" attraverso l'integrazione di reti ricorrenti (LSTM) e del meccanismo Connectionist Temporal Classification (CTC) per il riconoscimento del testo manoscritto e sequenziale (HTR). La parte conclusiva esplora le frontiere attuali del Visual Document Understanding, analizzando l'impiego dei meccanismi di self-attention con il modello TrOCR e gli approcci OCR-free come Donut e LayoutLM. Infine, vengono discusse le applicazioni specialistiche nella paleografia digitale e nella valorizzazione del patrimonio storico attraverso piattaforme come Transkribus. Il lavoro dimostra come la sinergia tra visione artificiale e modelli linguistici stia trasformando l'OCR in uno strumento olistico di comprensione documentale, essenziale per la conservazione della memoria storica globale.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Di Varano, Lorenzo
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
OCR,Intelligenza Artificiale,Deep Learning,Pattern Recognition,Reti Neurali Convoluzionali,Transformer,HTR,Document Understanding,Binarizzazione,Segmentazione,Long Short-Term Memory,Connectionist Temporal Classification,Transfer Learning,Data Augmentation,Paleografia Digitale,Transkribus,ResNet,MobileNet,Self-Attention,Donut,LayoutLM
Data di discussione della Tesi
13 Marzo 2026
URI

Altri metadati

Gestione del documento: Visualizza il documento

^