Riconoscimento di Testo da Ricevute Cartacee con Tecnologie Tradizionali e di Deep Learning mediante Client Android

Mattioli, Simone (2020) Riconoscimento di Testo da Ricevute Cartacee con Tecnologie Tradizionali e di Deep Learning mediante Client Android. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento ad accesso riservato.
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (6MB) | Contatta l'autore

Abstract

Sempre più aziende hanno necessità di digitalizzare ciò che fino a qualche hanno fa veniva scritto o stampato su carta. Questa tesi presenta una nuova soluzione che permette di digitalizzare il contenuto di un documento cartaceo ed analizzare quelle esistenti in letteratura. Vengono passo passo illustrate tutte le fasi dello sviluppo, dall'architettura client- server, alla divisione in micro-servizi, dalla creazione dell'applicazione mobile, al dialogo con il server. In particolare viene approfondito il framework Tesseract insieme con i propri punti di forza, limiti e come rendere il suo output il migliore possibile. Infine sono eseguiti una serie di test per analizzare il pre-processing di immagini tramite la libreria OpenCV e come il risultato influenza l'output di Tesseract.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Mattioli, Simone
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
OCR,machine learning,deep neural network,python,android
Data di discussione della Tesi
8 Ottobre 2020
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^