Lena, Erika
(2021)
Combining Vector Space Model and Word2Vec: a preliminary study.
[Laurea], Università di Bologna, Corso di Studio in
Informatica [L-DM270], Documento ad accesso riservato.
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (827kB)
| Contatta l'autore
|
Abstract
This paper investigates traditional Information Retrieval (IR) methods for syntax evaluation of documents.
The main aim of this study is to search for a method to combine
IR models with new studies in Natural Language Processing (NLP),
specifically with Word2Vec model.
These techniques provide a semantic distributed
representation of terms which can be used to improve retrieval and documents ranking.
The present work focus on the selection of words to be used for documents retrieval.
A further point of interest is the research of a suitable weighting
scheme to be applied for the evaluation of additional information,
provided by the use of Word2Vec word embeddings.
Abstract
This paper investigates traditional Information Retrieval (IR) methods for syntax evaluation of documents.
The main aim of this study is to search for a method to combine
IR models with new studies in Natural Language Processing (NLP),
specifically with Word2Vec model.
These techniques provide a semantic distributed
representation of terms which can be used to improve retrieval and documents ranking.
The present work focus on the selection of words to be used for documents retrieval.
A further point of interest is the research of a suitable weighting
scheme to be applied for the evaluation of additional information,
provided by the use of Word2Vec word embeddings.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Lena, Erika
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Information Retrieval,Word2Vec,Natural Language Processing
Data di discussione della Tesi
14 Luglio 2021
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Lena, Erika
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Information Retrieval,Word2Vec,Natural Language Processing
Data di discussione della Tesi
14 Luglio 2021
URI
Statistica sui download
Gestione del documento: