Mattioli, Simone
(2020)
Riconoscimento di Testo da Ricevute Cartacee con Tecnologie Tradizionali e di Deep Learning mediante Client Android.
[Laurea], Università di Bologna, Corso di Studio in
Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento ad accesso riservato.
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (6MB)
| Contatta l'autore
|
Abstract
Sempre più aziende hanno necessità di digitalizzare ciò che fino a qualche hanno fa veniva scritto o stampato su carta. Questa tesi presenta una nuova soluzione che permette di digitalizzare il contenuto di un documento cartaceo ed analizzare quelle esistenti in letteratura. Vengono passo passo illustrate tutte le fasi dello sviluppo, dall'architettura client- server, alla divisione in micro-servizi, dalla creazione dell'applicazione mobile, al dialogo con il server. In particolare viene approfondito il framework Tesseract insieme con i propri punti di forza, limiti e come rendere il suo output il migliore possibile. Infine sono eseguiti una serie di test per analizzare il pre-processing di immagini tramite la libreria OpenCV e come il risultato influenza l'output di Tesseract.
Abstract
Sempre più aziende hanno necessità di digitalizzare ciò che fino a qualche hanno fa veniva scritto o stampato su carta. Questa tesi presenta una nuova soluzione che permette di digitalizzare il contenuto di un documento cartaceo ed analizzare quelle esistenti in letteratura. Vengono passo passo illustrate tutte le fasi dello sviluppo, dall'architettura client- server, alla divisione in micro-servizi, dalla creazione dell'applicazione mobile, al dialogo con il server. In particolare viene approfondito il framework Tesseract insieme con i propri punti di forza, limiti e come rendere il suo output il migliore possibile. Infine sono eseguiti una serie di test per analizzare il pre-processing di immagini tramite la libreria OpenCV e come il risultato influenza l'output di Tesseract.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Mattioli, Simone
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
OCR,machine learning,deep neural network,python,android
Data di discussione della Tesi
8 Ottobre 2020
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Mattioli, Simone
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
OCR,machine learning,deep neural network,python,android
Data di discussione della Tesi
8 Ottobre 2020
URI
Statistica sui download
Gestione del documento: