Panni, Mattia
(2023)
scilay: un nuovo dataset per long document
summarization scientifici e divulgativi di
studi biomedici.
[Laurea], Università di Bologna, Corso di Studio in
Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento ad accesso riservato.
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Full-text non accessibile fino al 17 Novembre 2024.
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (3MB)
| Contatta l'autore
|
Abstract
Questa tesi esplora il prospero settore dell’intelligenza artificiale (AI) e dell’elaborazione del linguaggio naturale (NLP), con l’obiettivo di automatizzare la creazione di riassunti comprensibili per gli articoli scientifici. Sfruttando metodologie AI all’avanguardia, questo studio si propone di ridurre il divario tra
i dettagli intricati racchiusi nelle pubblicazioni scientifiche e la loro comprensione da parte del grande pubblico. La complessità e la profondità tecnica degli articoli accademici spesso costituiscono una barriera alla comprensione generalizzata.
Mentre gli abstract tecnici si rivolgono bene agli esperti del settore, possono risultare criptici per i “non addetti ai lavori”. Affrontando questo divario comunicativo, la tesi propone un nuovo dataset denominato SciLay il cui scopo è quello di fornire una base solida per l’addestramento di modelli di generazione automatica di riassunti laici (o lay) e tecnici di ricerche scientifiche.
Abstract
Questa tesi esplora il prospero settore dell’intelligenza artificiale (AI) e dell’elaborazione del linguaggio naturale (NLP), con l’obiettivo di automatizzare la creazione di riassunti comprensibili per gli articoli scientifici. Sfruttando metodologie AI all’avanguardia, questo studio si propone di ridurre il divario tra
i dettagli intricati racchiusi nelle pubblicazioni scientifiche e la loro comprensione da parte del grande pubblico. La complessità e la profondità tecnica degli articoli accademici spesso costituiscono una barriera alla comprensione generalizzata.
Mentre gli abstract tecnici si rivolgono bene agli esperti del settore, possono risultare criptici per i “non addetti ai lavori”. Affrontando questo divario comunicativo, la tesi propone un nuovo dataset denominato SciLay il cui scopo è quello di fornire una base solida per l’addestramento di modelli di generazione automatica di riassunti laici (o lay) e tecnici di ricerche scientifiche.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Panni, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Abstractive Summarization,Natural Language Processing,Deep Neural Networks,Seq2Seq Models,Large Language Models
Data di discussione della Tesi
30 Novembre 2023
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Panni, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Abstractive Summarization,Natural Language Processing,Deep Neural Networks,Seq2Seq Models,Large Language Models
Data di discussione della Tesi
30 Novembre 2023
URI
Gestione del documento: