Albertini, Federica
(2016)
Development and evaluation of an OCR system for industrial applications.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Questa tesi descrive il lavoro portato a termine durante un tirocinio di sei mesi svolto in Datalogic ADC, presso la sede di Pasadena, California. Durante questa esperienza sono stata coinvolta nella concretizzazione di un vero e proprio prodotto industriale: un software di riconoscimento ottico di caratteri (OCR) basato sugli istogrammi di gradienti orientati (HOG).
L'oggetto del lavoro di tesi comprende l'implementazione di un algoritmo di OCR in grado di leggere una o più righe di testo all'interno di una stessa regione di interesse garantendo velocità e accuratezza richieste in ambito industriale.
E’ possibile suddividere la realizzazione in 3 momenti: l'analisi del prototipo precedentemente realizzato, l'implementazione del nuovo prodotto e la fase finale di test per confrontarlo con i migliori algoritmi allo stato dell'arte.
Un'attenta fase di studio ha portato alla rielaborazione e ottimizzazione del precedente modello, al fine di porre le basi per la concretizzazione del nuovo tool. In seguito, integrando funzioni apposite al soddisfacimento dei requisiti, una prima versione del
prodotto è stata realizzata con particolare attenzione a modularità e correttezza del codice.
Il progetto è stato poi ulteriormente esteso al funzionamento con rappresentazione fixed-point per renderlo integrabile su smart camera: questa modifica, resa necessaria dalla mancanza di floating-point unit sui sistemi embedded, ha richiesto l'implementazione di un' apposita libreria di gestione.
A seguire, per testare robustezza e affidabilità dell'algoritmo, sono stati effettuati test su dataset forniti da reali clienti. Una finale fase di benchmark, confrontando il lavoro svolto con un noto tool commerciale allo stato dell'arte, è stata portata a termine al fine
di prevedere un possibile impatto sul mercato.
I risultati degli esperimenti condotti hanno portato ad interessanti risultati che potranno essere utilizzati per futuri sviluppi e miglioramenti del software OCR.
Abstract
Questa tesi descrive il lavoro portato a termine durante un tirocinio di sei mesi svolto in Datalogic ADC, presso la sede di Pasadena, California. Durante questa esperienza sono stata coinvolta nella concretizzazione di un vero e proprio prodotto industriale: un software di riconoscimento ottico di caratteri (OCR) basato sugli istogrammi di gradienti orientati (HOG).
L'oggetto del lavoro di tesi comprende l'implementazione di un algoritmo di OCR in grado di leggere una o più righe di testo all'interno di una stessa regione di interesse garantendo velocità e accuratezza richieste in ambito industriale.
E’ possibile suddividere la realizzazione in 3 momenti: l'analisi del prototipo precedentemente realizzato, l'implementazione del nuovo prodotto e la fase finale di test per confrontarlo con i migliori algoritmi allo stato dell'arte.
Un'attenta fase di studio ha portato alla rielaborazione e ottimizzazione del precedente modello, al fine di porre le basi per la concretizzazione del nuovo tool. In seguito, integrando funzioni apposite al soddisfacimento dei requisiti, una prima versione del
prodotto è stata realizzata con particolare attenzione a modularità e correttezza del codice.
Il progetto è stato poi ulteriormente esteso al funzionamento con rappresentazione fixed-point per renderlo integrabile su smart camera: questa modifica, resa necessaria dalla mancanza di floating-point unit sui sistemi embedded, ha richiesto l'implementazione di un' apposita libreria di gestione.
A seguire, per testare robustezza e affidabilità dell'algoritmo, sono stati effettuati test su dataset forniti da reali clienti. Una finale fase di benchmark, confrontando il lavoro svolto con un noto tool commerciale allo stato dell'arte, è stata portata a termine al fine
di prevedere un possibile impatto sul mercato.
I risultati degli esperimenti condotti hanno portato ad interessanti risultati che potranno essere utilizzati per futuri sviluppi e miglioramenti del software OCR.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Albertini, Federica
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
OCR,riconoscimento ottico di caratteri,HOG,HOG descriptors,optical characters recognition,histograms of oriented grandients
Data di discussione della Tesi
19 Dicembre 2016
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Albertini, Federica
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
OCR,riconoscimento ottico di caratteri,HOG,HOG descriptors,optical characters recognition,histograms of oriented grandients
Data di discussione della Tesi
19 Dicembre 2016
URI
Gestione del documento: