Piozzi, Federico
(2024)
Analisi e miglioramento prestazionale dell'imputazione di dati di metilazione con methyLImp2.
[Laurea], Università di Bologna, Corso di Studio in
Informatica [L-DM270]
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (367kB)
|
Abstract
Background:
La metilazione del DNA è una modificazione epigenetica che interessa i siti CpG (citosina-fosfato-guanina) del DNA. Essa ha numerose implicazioni nello sviluppo e nell'invecchiamento fisico umano nonché nello sviluppo di patologie come il cancro.
Per questo molte ricerche si interessano a questo processo biologico stimolate anche dall'introduzione di tecnologie che permettono un'elevata caratterizzazione dei livelli di metilazione del genoma umano. Le sperimentazioni svolte
su profili di metilazione contengono spesso dati mancanti che possono compromettere l’analisi sui dati di metilazione ottenuti. Per questo motivo si utilizzano tecniche di imputazione per stimare i dati mancanti. Da un confronto tra le
tecniche disponibili si è rilevato come alcune siano risultate più adatte nel trattare
dati di metilazione. In particolare si è distinta una tecnica di imputazione chiamata methyLImp in quanto pensata appositamente per trattare dati di metilazione. Essa
ha dimostrato di performare meglio sia in termini di accuratezza che in termini di efficienza.
Risultati: Si sono svolti test utilizzando la versione più recente methyLImp2 di methyLImp lavorando su set di dati di metilazione con rappresentazione in β-values, sui quali
sono stati simulati valori mancanti rifacendosi alle distribuzioni di valori mancanti estrapolate da set di dati di metilazione reali. I test si sono svolti in due fasi: la prima imputando i valori mancanti senza sfruttare le funzionalità introdotte con me-
thyLImp2, la seconda sfruttando la funzionalità di parallelizzazione su cromosomi. Si è poi svolto un confronto tra le imputazioni delle due fasi in termini di accuratezza ed efficienza osservando le differenze ed i miglioramenti ottenuti.
Conclusioni: Le analisi svolte sui risultati ottenuti nei test hanno permesso di capire come sfruttare alcune delle nuove funzionalità fornite da methyLImp2 ottenendo tempi di esecuzione nettamente minori pur mantenendo l’accuratezza invariata.
Abstract
Background:
La metilazione del DNA è una modificazione epigenetica che interessa i siti CpG (citosina-fosfato-guanina) del DNA. Essa ha numerose implicazioni nello sviluppo e nell'invecchiamento fisico umano nonché nello sviluppo di patologie come il cancro.
Per questo molte ricerche si interessano a questo processo biologico stimolate anche dall'introduzione di tecnologie che permettono un'elevata caratterizzazione dei livelli di metilazione del genoma umano. Le sperimentazioni svolte
su profili di metilazione contengono spesso dati mancanti che possono compromettere l’analisi sui dati di metilazione ottenuti. Per questo motivo si utilizzano tecniche di imputazione per stimare i dati mancanti. Da un confronto tra le
tecniche disponibili si è rilevato come alcune siano risultate più adatte nel trattare
dati di metilazione. In particolare si è distinta una tecnica di imputazione chiamata methyLImp in quanto pensata appositamente per trattare dati di metilazione. Essa
ha dimostrato di performare meglio sia in termini di accuratezza che in termini di efficienza.
Risultati: Si sono svolti test utilizzando la versione più recente methyLImp2 di methyLImp lavorando su set di dati di metilazione con rappresentazione in β-values, sui quali
sono stati simulati valori mancanti rifacendosi alle distribuzioni di valori mancanti estrapolate da set di dati di metilazione reali. I test si sono svolti in due fasi: la prima imputando i valori mancanti senza sfruttare le funzionalità introdotte con me-
thyLImp2, la seconda sfruttando la funzionalità di parallelizzazione su cromosomi. Si è poi svolto un confronto tra le imputazioni delle due fasi in termini di accuratezza ed efficienza osservando le differenze ed i miglioramenti ottenuti.
Conclusioni: Le analisi svolte sui risultati ottenuti nei test hanno permesso di capire come sfruttare alcune delle nuove funzionalità fornite da methyLImp2 ottenendo tempi di esecuzione nettamente minori pur mantenendo l’accuratezza invariata.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Piozzi, Federico
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
methyLImp,methyLImp2,dati di metilazione,metilazione,valori mancanti,imputazione
Data di discussione della Tesi
13 Marzo 2024
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Piozzi, Federico
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
methyLImp,methyLImp2,dati di metilazione,metilazione,valori mancanti,imputazione
Data di discussione della Tesi
13 Marzo 2024
URI
Statistica sui download
Gestione del documento: