Domain-specific word embeddings for ICD-9-CM classification

Calarota, Gabriele (2018) Domain-specific word embeddings for ICD-9-CM classification. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (1MB)

Abstract

In this work we evaluate domain-speci�c embedding models induced from textual resources in the medical domain. The International Classi�cation of Diseases (ICD) is a standard, broadly used classi�cation system, that codes a large number of speci�c diseases, symptoms, injuries and medical procedures into numerical classes. Assigning a code to a clinical case means classifying that case into one or more particular discrete class, hence allowing further statistics studies and automated calculations. The possibility to have a discrete code instead of a text in natural language is intuitively a great advantage for data processing systems. The use of such classi�cation is becoming increasingly important for, but not limited to, economic and policy-making purposes. Experiments show that domain-speci�c word embeddings, instead of a general one, improves classi�ers in terms of frequency similarities between words.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Calarota, Gabriele
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
icd-9-cm,word embeddings,domain-specific,document expansion,text classification
Data di discussione della Tesi
17 Ottobre 2018
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^