Bartolini, Filippo
(2021)
Analisi e implementazione di un parser neurale per la lingua italiana.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Informatica [LM-DM270]
Documenti full-text disponibili:
Abstract
Questo lavoro di tesi si focalizza sul task di dependency parsing per la lingua italiana attraverso l’utilizzo di UmBERTo: un recente word embedding contestuale derivato da BERT. In particolare, inizialmente vengono descritti e analizzati i risultati ottenuti grazie alle sole applicazioni delle rappresentazioni linguistiche di UmBERTo. Successivamente, si sono testati i benefici ottenibili dall’inserimento di UmBERTo all’interno del recente parser PaT (ParsingAsTagging), il quale tratta il problema del dependency parsing come uno di sequence tagging. Infine, prendendo ispirazione dal parser allo stato dell’arte per l’italiano, si sono sperimentate alcune modifiche al parser PaT integrato con UmBERTo, ottenendo alcuni, seppur modesti, miglioramenti. Per tutti gli esperimenti è stato utilizzato un corpus italiano di dominio generico presente nelle Universal Dependencies.
Abstract
Questo lavoro di tesi si focalizza sul task di dependency parsing per la lingua italiana attraverso l’utilizzo di UmBERTo: un recente word embedding contestuale derivato da BERT. In particolare, inizialmente vengono descritti e analizzati i risultati ottenuti grazie alle sole applicazioni delle rappresentazioni linguistiche di UmBERTo. Successivamente, si sono testati i benefici ottenibili dall’inserimento di UmBERTo all’interno del recente parser PaT (ParsingAsTagging), il quale tratta il problema del dependency parsing come uno di sequence tagging. Infine, prendendo ispirazione dal parser allo stato dell’arte per l’italiano, si sono sperimentate alcune modifiche al parser PaT integrato con UmBERTo, ottenendo alcuni, seppur modesti, miglioramenti. Per tutti gli esperimenti è stato utilizzato un corpus italiano di dominio generico presente nelle Universal Dependencies.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Bartolini, Filippo
Relatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM A: TECNICHE DEL SOFTWARE
Ordinamento Cds
DM270
Parole chiave
NLP,Dependency Parsing,Universal Dependencies,Deep Neural Networks,BERT,UmBERTo
Data di discussione della Tesi
18 Marzo 2021
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Bartolini, Filippo
Relatore della tesi
Scuola
Corso di studio
Indirizzo
CURRICULUM A: TECNICHE DEL SOFTWARE
Ordinamento Cds
DM270
Parole chiave
NLP,Dependency Parsing,Universal Dependencies,Deep Neural Networks,BERT,UmBERTo
Data di discussione della Tesi
18 Marzo 2021
URI
Statistica sui download
Gestione del documento: