Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data

Marcelli, Fulvio (2016) Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270]
Documenti full-text disponibili:
[thumbnail of tesi.pdf]
Anteprima
Documento PDF
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 (CC BY-NC-SA 3.0)

Download (2MB) | Anteprima

Abstract

La tesi ha lo scopo di introdurre Investiga, un'applicazione per l'estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione di queste informazioni secondo i principi e i formati Linked Open Data, creata per la tesi. Questa applicazione è basata sul Task 2 della SemPub 2016, una challenge che ha come scopo principale quello di migliorare l'estrazione di informazioni da articoli scientifici in formato PDF. Investiga estrae i capitoli di primo livello, le didascalie delle figure e delle tabelle da un dato articolo e crea un grafo delle informazioni così estratte collegate adeguatamente tra loro. La tesi inoltre analizza gli strumenti esistenti per l'estrazione automatica di informazioni da documenti PDF e dei loro limiti.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Marcelli, Fulvio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
PDF,estrazione,Linked Open Data,dataset RDF
Data di discussione della Tesi
13 Luglio 2016
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^