Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data

Marcelli, Fulvio (2016) Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270]

Salva citazione

Documenti full-text disponibili:

Anteprima

Documento PDF
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 (CC BY-NC-SA 3.0)
Download (2MB) | Anteprima

Abstract

La tesi ha lo scopo di introdurre Investiga, un'applicazione per l'estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione di queste informazioni secondo i principi e i formati Linked Open Data, creata per la tesi. Questa applicazione è basata sul Task 2 della SemPub 2016, una challenge che ha come scopo principale quello di migliorare l'estrazione di informazioni da articoli scientifici in formato PDF. Investiga estrae i capitoli di primo livello, le didascalie delle figure e delle tabelle da un dato articolo e crea un grafo delle informazioni così estratte collegate adeguatamente tra loro. La tesi inoltre analizza gli strumenti esistenti per l'estrazione automatica di informazioni da documenti PDF e dei loro limiti.

Abstract

Tipologia del documento

Tesi di laurea (Laurea)

Autore della tesi

Marcelli, Fulvio

Relatore della tesi

Di Iorio, Angelo

Scuola

Scienze

Corso di studio

Informatica [L-DM270]

Ordinamento Cds