Estensione della copertura terminologica del metatesauro biomedicale UMLS mediante allineamento con Wikipedia

Pacielli, Alessandro (2021) Estensione della copertura terminologica del metatesauro biomedicale UMLS mediante allineamento con Wikipedia. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Lo Unified Medical Language System (UMLS) è un’ontologia biomedicale multilingue sviluppata dalla National Library of Medicine degli Stati Uniti, il cui metatesauro rappresenta una risorsa di grande valore per lo sviluppo di applicazioni di Natural Language Processing in tale dominio. Purtroppo i 4.5 milioni di concetti attualmente presenti nel vocabolario non sono tradotti in tutte le lingue disponibili, infatti meno del 4% dei concetti ha una traduzione in Italiano. Per ovviare a questa problematica proponiamo un metodo di allineamento tra UMLS e Wikipedia, ovvero un sistema per trovare la pagina Wikipedia corrispondente a ciascun concetto UMLS ed estrapolare da questa una traduzione. In questo lavoro abbiamo dunque individuato dataset pre-esistenti, implementato un sistema di allineamento basato su tecniche di Natural Language Processing e Machine Learning e ottenuto un risultato che potrà essere utilizzato per tradurre i concetti in lingua Italiana e per costruire sistemi di allineamento più avanzati.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Pacielli, Alessandro
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
NLP,ML,Ontology Alignment,UMLS,Wikipedia,Translation,Wikidata,Embedding
Data di discussione della Tesi
3 Dicembre 2021
URI

Altri metadati

Gestione del documento: Visualizza il documento

^