Subgraph Retrieval for Biomedical Open-Domain Question Answering: Predicting Relational Paths with Language Models

Achilli, Mattia (2023) Subgraph Retrieval for Biomedical Open-Domain Question Answering: Predicting Relational Paths with Language Models. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [LM-DM270] - Cesena, Documento ad accesso riservato.
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Full-text non accessibile fino al 31 Dicembre 2024.
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 4.0 (CC BY-NC-ND 4.0)

Download (2MB) | Contatta l'autore

Abstract

Negli ultimi anni, l'open book question answering (QA) è diventato un campo di ricerca di grande interesse, che mira a rispondere a domande complesse utilizzando conoscenze esterne. La maggior parte delle soluzioni esistenti si basa sull'utilizzo di grafi per rappresentare la conoscenza semantica, strutturata e non ambigua, che può essere utilizzata per rispondere alle domande. Tuttavia, la costruzione di grafi su larga scala è una sfida complessa, che richiede l'utilizzo di tecniche di reasoning avanzate. Inoltre, molte delle soluzioni esistenti si basano su approcci discreti o simbolici, che sono inefficienti e portano a molto rumore. In questo lavoro di tesi, è stata progettata e implementata una soluzione di subgraph retrieval approssimata, che lavora all'interno di spazi densi ed è plug and play. Inoltre, la soluzione proposta si focalizza sul dominio biomedico, dove la conoscenza è molto vasta e spesso altamente specializzata. In particolare, la soluzione proposta si basa sul predire, partendo dalle entità della domanda, le relazioni da visitare in modo autoregressivo grazie al fine-tuning di un language model biomedico encoder only e cross document allo stato dell'arte, cosi da sfruttare al massimo la conoscenza e il significato del testo e dei concetti. La soluzione proposta è stata testata e confrontata con diverse tecniche di KG embedding come TransE e DistMult, e query SPARQL attraverso GraphDB. I risultati empirici mostrano l'efficacia e l'efficienza della soluzione proposta all'interno della tesi, comparata a quelle disponibili in letteratura.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Achilli, Mattia
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Open-domain Question Answering,Subgraph Retrieval,Dense Information Retrieval,Knowledge Graph Embedding,Language Models
Data di discussione della Tesi
17 Marzo 2023
URI

Altri metadati

Gestione del documento: Visualizza il documento

^