Realizzazione di un motore di ricerca semantico basato sui Document Embedding

Scala, Simone (2017) Realizzazione di un motore di ricerca semantico basato sui Document Embedding. [Laurea magistrale], Università di Bologna, Corso di Studio in Informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Il presente elaborato propone lo sviluppo di un motore di ricerca semantico in grado di estrapolare contenuti all'interno di una vasta gamma di informazioni testuali. Verranno definite delle tecniche di ricerca capaci di interpretare il significato contestuale di interrogazioni formulate in linguaggio naturale. Il metodo impiegato per effettuare le suddette ricerche si basa sull'analisi semantica distribuzionale, argomento di rilevante impatto nel campo dell’elaborazione del linguaggio naturale. Uno dei più recenti sviluppi in tale ambito ha portato alla formulazione di metodi noti in letteratura come Document Embedding fino a ottenere, con Paragraph Vector e tecnologie affini, la possibilità di mappare semanticamente intere porzioni di testo. Questi sviluppi aprono nuove possibilità legate all'implementazione di nuove tecniche su cui strutturare i motori di ricerca. Il contributo sarà quindi quello di realizzare un innovativo sistema di question answering (QA) basato sul modello semantico vettoriale di Document Embedding, in grado di rispondere automaticamente a una domanda espressa in linguaggio naturale. L'esperimento sarà condotto su un corpus di testi proveniente da Wikipedia. L'efficacia di questo sistema sarà poi misurata in maniera sperimentale considerando un test set di domande casuali (inerenti il corpus) che potrebbero essere poste a un motore di ricerca. I risultati che affioreranno da tale analisi mostreranno come i modelli di Document Embedding siano effettivamente idonei allo scopo prefissato.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Scala, Simone
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Ordinamento Cds
DM270
Parole chiave
Semantica,Elaborazione del linguaggio natuale,Motore di ricerca
Data di discussione della Tesi
20 Dicembre 2017
URI

Altri metadati

Gestione del documento: Visualizza il documento

^