Analisi e miglioramento prestazionale dell'imputazione di dati di metilazione con methyLImp2

Piozzi, Federico (2024) Analisi e miglioramento prestazionale dell'imputazione di dati di metilazione con methyLImp2. [Laurea], Università di Bologna, Corso di Studio in Informatica [L-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (367kB)

Abstract

Background: La metilazione del DNA è una modificazione epigenetica che interessa i siti CpG (citosina-fosfato-guanina) del DNA. Essa ha numerose implicazioni nello sviluppo e nell'invecchiamento fisico umano nonché nello sviluppo di patologie come il cancro. Per questo molte ricerche si interessano a questo processo biologico stimolate anche dall'introduzione di tecnologie che permettono un'elevata caratterizzazione dei livelli di metilazione del genoma umano. Le sperimentazioni svolte su profili di metilazione contengono spesso dati mancanti che possono compromettere l’analisi sui dati di metilazione ottenuti. Per questo motivo si utilizzano tecniche di imputazione per stimare i dati mancanti. Da un confronto tra le tecniche disponibili si è rilevato come alcune siano risultate più adatte nel trattare dati di metilazione. In particolare si è distinta una tecnica di imputazione chiamata methyLImp in quanto pensata appositamente per trattare dati di metilazione. Essa ha dimostrato di performare meglio sia in termini di accuratezza che in termini di efficienza. Risultati: Si sono svolti test utilizzando la versione più recente methyLImp2 di methyLImp lavorando su set di dati di metilazione con rappresentazione in β-values, sui quali sono stati simulati valori mancanti rifacendosi alle distribuzioni di valori mancanti estrapolate da set di dati di metilazione reali. I test si sono svolti in due fasi: la prima imputando i valori mancanti senza sfruttare le funzionalità introdotte con me- thyLImp2, la seconda sfruttando la funzionalità di parallelizzazione su cromosomi. Si è poi svolto un confronto tra le imputazioni delle due fasi in termini di accuratezza ed efficienza osservando le differenze ed i miglioramenti ottenuti. Conclusioni: Le analisi svolte sui risultati ottenuti nei test hanno permesso di capire come sfruttare alcune delle nuove funzionalità fornite da methyLImp2 ottenendo tempi di esecuzione nettamente minori pur mantenendo l’accuratezza invariata.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Piozzi, Federico
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
methyLImp,methyLImp2,dati di metilazione,metilazione,valori mancanti,imputazione
Data di discussione della Tesi
13 Marzo 2024
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^