Data and ground-truth generation for industrial deep learning applications

Zuffa, Flavio (2018) Data and ground-truth generation for industrial deep learning applications. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Questa tesi espone il lavoro che ho svolto durante la mia permanenza presso Datalogic USA Inc. che si trova ad Eugene(OR), USA. I sistemi OCR industriali si sono affidati per molti anni ai metodi classici della computer vision. I laboratori Datalogic stanno lavorando su sistemi basati sul deep learning per la creazione di sistemi di nuova generazione. I metodi che fanno uso di deep learning necessitano di una grande quantità di dati d'alta qualità per poter effettuare il processo di learning in modo efficace. Durante la mia permanenza ho lavorato sulla creazione di un sistema per la produzione di ground truth data, che verrà usata per il processo di deep learning dei sistemi di OCR. Si è lavorato su diversi tipi di hardware e in particolare su: Stampante ink jet industriale, tape reel, Arduino e fotocamera. L'hardware è stato modificato alla nostra bisogna; per esempio si è modificato il tape reel per automatizzare il cambiamento di velocità. Tutto l'hardware è stato interconnesso grazie ad un PC e l'Arduino. Allo scopo di produrre, gestire e stampare i messaggi che vengono stampati dalla stampante è stato creato del software; questo ci ha permesso di sfruttare la stampante al limite delle sue capacità. Necessitiamo di tantissimi messaggi diversi, mentre la stampante è fatta per stampare grandi quantità di messaggi uguali. Sono stati sviluppati due algoritmi indipendenti per la creazione della ground truth. L'algoritmo Top Down, inizia localizzando il messaggio all'interno dell'immagine catturata, poi i caratteri ed infine i punti che formano i caratteri. L'algoritmo Bottom Up, parte dalla localizzazione dei punti per poi ricostruire i caratteri ed infine l'intero messaggio. Entrambi gli algoritmi hanno dimostrato di essere validi, c'è la possibilità che una combinazione di entrambi possa produrre un algoritmo ancora migliore. Datalogic sta continuando nello sviluppo di questo progetto, migliorandolo e usandolo per la produzione di ground truth data.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Zuffa, Flavio
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
computer vision,deep learning,OCR,industrial OCR,data science,ground truth,ground truth algorithms
Data di discussione della Tesi
23 Luglio 2018
URI

Altri metadati

Gestione del documento: Visualizza il documento

^