tonicarD: un'applicazione web per l'annotazione semiautomatica delle schede Caronti

Castagnotto, Luca (2022) tonicarD: un'applicazione web per l'annotazione semiautomatica delle schede Caronti. [Laurea magistrale], Università di Bologna, Corso di Studio in Informatica [LM-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 4.0 (CC BY-NC-ND 4.0)

Download (3MB)

Abstract

Si presenta lo sviluppo di una nuova applicazione web, chiamata tonicarD, che fornisce gli strumenti per fare annotazione dei documenti che costituiscono il catalogo storico della Biblioteca Universitaria di Bologna. Si tratta di schede scritte a mano dal dott. Andrea Caronti nella seconda metà dell'Ottocento, che si ha interesse a digitalizzare. A questo scopo, si è progettato il sistema tonicarD, che permette di eseguire la segmentazione e la trascrizione delle scansioni di tali documenti e genera le immagini che verrano usate per popolare un dataset su cui allenare un modello di riconoscimento automatico del testo. L'applicazione implementa anche lo sviluppo di un algoritmo di segmentazione automatica, oltre che un'approssimativa trascrizione della scheda, con l'obiettivo di agevolare l'utente nell'esecuzione dell'annotazione. Il lavoro include anche test per misurare la qualità della segmentazione automatica e test di usabilità dell'interfaccia, in cui si mettono a confronto l'esperienza degli utenti su tonicarD e Transkribus.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Castagnotto, Luca
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM A: TECNICHE DEL SOFTWARE
Ordinamento Cds
DM270
Parole chiave
annotazione,segmentazione,trascrizione,applicazione web,tonicard,caronti,segmentazione automatica,transkribus,test di usabilità
Data di discussione della Tesi
15 Dicembre 2022
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^