Marcelli, Fulvio
(2016)
Estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione in Linked Open Data.
[Laurea], Università di Bologna, Corso di Studio in
Informatica [L-DM270]
Documenti full-text disponibili:
Abstract
La tesi ha lo scopo di introdurre Investiga, un'applicazione per l'estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione di queste informazioni secondo i principi e i formati Linked Open Data, creata per la tesi.
Questa applicazione è basata sul Task 2 della SemPub 2016, una challenge che ha come scopo principale quello di migliorare l'estrazione di informazioni da articoli scientifici in formato PDF.
Investiga estrae i capitoli di primo livello, le didascalie delle figure e delle tabelle da un dato articolo e crea un grafo delle informazioni così estratte collegate adeguatamente tra loro.
La tesi inoltre analizza gli strumenti esistenti per l'estrazione automatica di informazioni da documenti PDF e dei loro limiti.
Abstract
La tesi ha lo scopo di introdurre Investiga, un'applicazione per l'estrazione automatica di informazioni da articoli scientifici in formato PDF e pubblicazione di queste informazioni secondo i principi e i formati Linked Open Data, creata per la tesi.
Questa applicazione è basata sul Task 2 della SemPub 2016, una challenge che ha come scopo principale quello di migliorare l'estrazione di informazioni da articoli scientifici in formato PDF.
Investiga estrae i capitoli di primo livello, le didascalie delle figure e delle tabelle da un dato articolo e crea un grafo delle informazioni così estratte collegate adeguatamente tra loro.
La tesi inoltre analizza gli strumenti esistenti per l'estrazione automatica di informazioni da documenti PDF e dei loro limiti.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Marcelli, Fulvio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
PDF,estrazione,Linked Open Data,dataset RDF
Data di discussione della Tesi
13 Luglio 2016
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Marcelli, Fulvio
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
PDF,estrazione,Linked Open Data,dataset RDF
Data di discussione della Tesi
13 Luglio 2016
URI
Statistica sui download
Gestione del documento: