Automatizzare la Codifica Clinica con i Large Language Models: Un Approccio per Migliorare la Codifica ICD in Regimi Low-Resource

Buda, Francesco (2024) Automatizzare la Codifica Clinica con i Large Language Models: Un Approccio per Migliorare la Codifica ICD in Regimi Low-Resource. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

La codifica di documenti sanitari è un attività che consiste nell’assegnare codici relativi a diagnosi legate alla medicina a partire da note mediche scritte sotto forma di testo libero. È un’attività svolta manualmente da professionisti della salute con lo scopo di tenere traccia di diagnosi e procedure relative ai pazienti. Rendere questo processo completamente o parzialmente automatico è un ambito di ricerca molto importante in quanto permetterebbe di far risparmiare moltissimo lavoro meccanico e ripetitivo a molti medici esperti. In questo studio si iniziano ad esplorare le possibilità che i nuovi Large Language Models possono offrire in questo campo, fornendo una strategia operativa composta da due fasi: nella prima si seleziona, utilizzando un modello sentence transformer e calcolando le similarità tra termini medici ed etichette, un sottoinsieme ristretto di codici contenente il maggior numero possibile di label corrette; nella seconda fase invece, si sfrutta un large language model per analizzare a pieno il contenuto della nota medica e selezionare tra i codici restituiti dalla prima fase, le etichette più adatte. L’approccio proposto e implementato è risultato promettente e fornisce una buona base per la ricerca futura, che può portare all’utilizzo effettivo del sistema descritto per situazioni reali anche in regimi Low-Resource.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Buda, Francesco
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Large Language Models,Natural Language Processing,Sentence Transformer,Medicina,Classificazione ICD
Data di discussione della Tesi
28 Novembre 2024
URI

Altri metadati

Gestione del documento: Visualizza il documento

^