Documenti full-text disponibili:
Abstract
L’obiettivo di questo lavoro, nel contesto della text summarization, eviden-
ziare le limitazioni degli attuali language model nel concentrarsi sulle parti
rilevanti di un documento. Coinvolgendo la specializzazione di un modello
nella generazione di sequenze di testo o frasi comuni tra l’articolo originale
e il suo riassunto. Attraverso esperimenti condotti utilizzando il dataset di
arXiv [Cohan et al., 2018], e SciLay. Il lavoro metterà in luce che, pur esi-
stendo opportunità di apportare miglioramenti significativi in alcuni contesti,
tali miglioramenti rimangono fuori portata a causa di alcune restrizioni nei
modelli attuali. La struttura della tesi prevede l’analisi delle diverse tecniche
di estrazione del testo comune, la definizione dei vari algoritmi impiegati, il
loro potenziale di miglioramento e la valutazione delle performance di ciascun
modello mediante il fine tuning in ogni fase del processo.
vii
Abstract
L’obiettivo di questo lavoro, nel contesto della text summarization, eviden-
ziare le limitazioni degli attuali language model nel concentrarsi sulle parti
rilevanti di un documento. Coinvolgendo la specializzazione di un modello
nella generazione di sequenze di testo o frasi comuni tra l’articolo originale
e il suo riassunto. Attraverso esperimenti condotti utilizzando il dataset di
arXiv [Cohan et al., 2018], e SciLay. Il lavoro metterà in luce che, pur esi-
stendo opportunità di apportare miglioramenti significativi in alcuni contesti,
tali miglioramenti rimangono fuori portata a causa di alcune restrizioni nei
modelli attuali. La struttura della tesi prevede l’analisi delle diverse tecniche
di estrazione del testo comune, la definizione dei vari algoritmi impiegati, il
loro potenziale di miglioramento e la valutazione delle performance di ciascun
modello mediante il fine tuning in ogni fase del processo.
vii
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Di Pietro, Filippo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Deep Neural Networks,Machine Learning,Transformers,Text Summarization,Natural Language Processing
Data di discussione della Tesi
30 Novembre 2023
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Di Pietro, Filippo
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Deep Neural Networks,Machine Learning,Transformers,Text Summarization,Natural Language Processing
Data di discussione della Tesi
30 Novembre 2023
URI
Statistica sui download
Gestione del documento: