Calarota, Gabriele
(2018)
Domain-specific word embeddings for ICD-9-CM classification.
[Laurea], Università di Bologna, Corso di Studio in
Informatica [L-DM270]
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (1MB)
|
Abstract
In this work we evaluate domain-speci�c embedding models induced from textual resources
in the medical domain. The International Classi�cation of Diseases (ICD) is a
standard, broadly used classi�cation system, that codes a large number of speci�c diseases,
symptoms, injuries and medical procedures into numerical classes. Assigning a code to a
clinical case means classifying that case into one or more particular discrete class, hence
allowing further statistics studies and automated calculations. The possibility to have a
discrete code instead of a text in natural language is intuitively a great advantage for data
processing systems. The use of such classi�cation is becoming increasingly important
for, but not limited to, economic and policy-making purposes. Experiments show that
domain-speci�c word embeddings, instead of a general one, improves classi�ers in terms
of frequency similarities between words.
Abstract
In this work we evaluate domain-speci�c embedding models induced from textual resources
in the medical domain. The International Classi�cation of Diseases (ICD) is a
standard, broadly used classi�cation system, that codes a large number of speci�c diseases,
symptoms, injuries and medical procedures into numerical classes. Assigning a code to a
clinical case means classifying that case into one or more particular discrete class, hence
allowing further statistics studies and automated calculations. The possibility to have a
discrete code instead of a text in natural language is intuitively a great advantage for data
processing systems. The use of such classi�cation is becoming increasingly important
for, but not limited to, economic and policy-making purposes. Experiments show that
domain-speci�c word embeddings, instead of a general one, improves classi�ers in terms
of frequency similarities between words.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Calarota, Gabriele
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
icd-9-cm,word embeddings,domain-specific,document expansion,text classification
Data di discussione della Tesi
17 Ottobre 2018
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Calarota, Gabriele
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
icd-9-cm,word embeddings,domain-specific,document expansion,text classification
Data di discussione della Tesi
17 Ottobre 2018
URI
Statistica sui download
Gestione del documento: