Traduzione automatica dei documenti social condivisi da malati rari

Fabris, Anna (2020) Traduzione automatica dei documenti social condivisi da malati rari. [Laurea], Università di Bologna, Corso di Studio in Ingegneria e scienze informatiche [L-DM270] - Cesena
Documenti full-text disponibili:
[thumbnail of Thesis] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (1MB)

Abstract

Circa il 5% della popolazione mondiale è affetta da una delle oltre 6000 malattie rare oggi registrate. Il termine "raro" si riferisce quindi, non tanto alla percentuale di individui colpiti complessivamente, quanto, secondo la definizione dell’Unione Europea, a un’incidenza inferiore a un caso ogni 2000 abitanti. Le limitate conoscenze disponibili per ciascuna malattia portano i pazienti a dover ricercare informazioni in maniera autonoma, spesso mediante l’utilizzo dei social media. Questo ha dato vita a un’enorme quantità di contenuti testuali oggi in continua crescita, che è possibile analizzare efficacemente con soluzioni NLP (Natural Language Processing). La stragrande maggioranza dei tool attualmente disponibili è pensata per l’elaborazione di documenti in lingua inglese, giustificando l’importanza sia dello sviluppo di nuovi modelli multilingua che della traduzione di dataset esistenti per un maggior supporto sul piano implementativo. L’utilizzo dei traduttori automatici presenti in commercio è frequentemente non sufficiente, in quanto le traduzioni delle entità di dominio risultano imprecise, mentre sul piano del preprocessing ne è richiesta una gestione corretta. Questa tesi si pone come obbiettivo il confronto di molteplici tecniche di traduzione automatica e la proposta di un approccio che sappia gestire consapevolmente le entità di dominio tramite l’adozione di sistemi NER (Named Entity Recognition), prendendo come caso di studio un corpus di post e commenti condivisi su un gruppo Facebook di pazienti affetti da Acalasia Esofagea.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Fabris, Anna
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
machine translation,named-entity recognition,natural language processing,machine translation evaluation Metric,Rare Diseases
Data di discussione della Tesi
8 Ottobre 2020
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^