Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
L'avvento dell'internet ha portato ad un incremento considerevole nella quantità di testi digitali disponibili online. Visto la velocità con cui viaggiano le informazioni ci troviamo molto spesso a dover riepilogare un gran numero di dati per poter accedere alle informazioni chiave in modo dinamico. Da qui la nascita di grandi sforzi nel campo del Automatic Text Summarization e Multi-Document Summarization. Le applicazioni che queste tecnologie hanno portato ad oggi sono vaste e di grande utilità a molte aziende. Ad oggi la maggior parte dei modelli di ATS viene proposta e sviluppata dalle grosse imprese, grazie alle loro grossa quantità, quasi illimitata, di risorse e dati a disposizione. Il problema sorge con le piccole e medie imprese che vogliono utilizzare queste tecnologie, visto la quantità di risorse limitate. Nella nostra soluzione proponiamo l'utilizzo di una Graph Neural Network nel task di Multi-Document Summarization. Solo di recente è stato introdotto l'utilizzo delle GNN all'interno di ATS. Questo approccio porta una serie di vantaggi come la scalabilità e flessibilità del modello ed una migliore comprensione delle attività che vengono svolte. Il nostro modello si occupa di applicare un filtro ai documenti, selezionando un numero di frasi che vengono considerate come le più importanti per la generazione di un riepilogo. Le frasi selezionate vengono poi utilizzate da un modello ormai già costatato come tra i più performanti per MDS, PRIMERA. Utilizziamo un hardware accessibile e un dataset di un centinaio di entry per simulare la scarsità di risorse.
Abstract
L'avvento dell'internet ha portato ad un incremento considerevole nella quantità di testi digitali disponibili online. Visto la velocità con cui viaggiano le informazioni ci troviamo molto spesso a dover riepilogare un gran numero di dati per poter accedere alle informazioni chiave in modo dinamico. Da qui la nascita di grandi sforzi nel campo del Automatic Text Summarization e Multi-Document Summarization. Le applicazioni che queste tecnologie hanno portato ad oggi sono vaste e di grande utilità a molte aziende. Ad oggi la maggior parte dei modelli di ATS viene proposta e sviluppata dalle grosse imprese, grazie alle loro grossa quantità, quasi illimitata, di risorse e dati a disposizione. Il problema sorge con le piccole e medie imprese che vogliono utilizzare queste tecnologie, visto la quantità di risorse limitate. Nella nostra soluzione proponiamo l'utilizzo di una Graph Neural Network nel task di Multi-Document Summarization. Solo di recente è stato introdotto l'utilizzo delle GNN all'interno di ATS. Questo approccio porta una serie di vantaggi come la scalabilità e flessibilità del modello ed una migliore comprensione delle attività che vengono svolte. Il nostro modello si occupa di applicare un filtro ai documenti, selezionando un numero di frasi che vengono considerate come le più importanti per la generazione di un riepilogo. Le frasi selezionate vengono poi utilizzate da un modello ormai già costatato come tra i più performanti per MDS, PRIMERA. Utilizziamo un hardware accessibile e un dataset di un centinaio di entry per simulare la scarsità di risorse.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Lisotta, Marco
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Natural Language Processing,Machine Learning,Multi-Document Summarization,Graph Neural Networks,Python
Data di discussione della Tesi
17 Marzo 2023
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Lisotta, Marco
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Natural Language Processing,Machine Learning,Multi-Document Summarization,Graph Neural Networks,Python
Data di discussione della Tesi
17 Marzo 2023
URI
Gestione del documento: