Merlotti, Alessandra
(2017)
DNA sequence analysis: a statistical characterization of dinucleotides interdistances across multiple organisms.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Fisica [LM-DM270], Documento ad accesso riservato.
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (10MB)
| Contatta l'autore
|
Abstract
In questo lavoro abbiamo scelto un approccio basato sulle interdistanze per studiare le proprietà statistiche dei diversi dinucleotidi, in quanto riteniamo che vi sia una relazione tra la posizione che essi occupano nel genoma e la funzione biologica che essi svolgono. Sono stati perciò studiati 18 organismi modello appartenenti a diverse classi e dai risultati è emersa una netta differenza tra le distribuzioni dei CG dei mammiferi rispetto a quelle dei non CG; diversamente, nel caso dei non mammiferi la differenza è risultata essere più lieve e in alcuni casi nulla. In particolare, è emerso che le distribuzioni CG dei mammiferi risultano essere ben descritte da una distribuzione gamma, mentre nel caso dei non mammiferi, questo andamento è stato ritrovato solo in pochi casi. Si è visto inoltre che i CG dei mammiferi risultano essere in numero inferiore rispetto ai non CG, perciò è stato elaborato un modello nullo che provasse a rendere conto di questa discrepanza, imputandone la causa a mutazioni casuali di una singola base azotata. Il modello è stato applicato ai dinucleotidi di Homo sapiens e dai risultati è emerso che solo le distribuzioni AT e TA risultano simili a quella dei CG e che il processo è irreversibile. Infine si è visto che rappresentando il parametro di scala della distribuzione gamma, ricavato dal fit, in funzione del paramtero di forma, è stato possibile distringuere le diverse classi di organismi, sia per i dati di partenza che per un set più ampio; inoltre, i risultati mostrano l'esistenza di una relazione lineare tra il parametro di scala e la percentuale di CG presenti nella sequenza analizzata, se rappresentati in scala doppio logaritmica. Lo studio svolto ha dunque confermato l'esistenza di una relazione tra la posizione occupata dai CG nei genomi e la funzione biologica da essi svolta.
Abstract
In questo lavoro abbiamo scelto un approccio basato sulle interdistanze per studiare le proprietà statistiche dei diversi dinucleotidi, in quanto riteniamo che vi sia una relazione tra la posizione che essi occupano nel genoma e la funzione biologica che essi svolgono. Sono stati perciò studiati 18 organismi modello appartenenti a diverse classi e dai risultati è emersa una netta differenza tra le distribuzioni dei CG dei mammiferi rispetto a quelle dei non CG; diversamente, nel caso dei non mammiferi la differenza è risultata essere più lieve e in alcuni casi nulla. In particolare, è emerso che le distribuzioni CG dei mammiferi risultano essere ben descritte da una distribuzione gamma, mentre nel caso dei non mammiferi, questo andamento è stato ritrovato solo in pochi casi. Si è visto inoltre che i CG dei mammiferi risultano essere in numero inferiore rispetto ai non CG, perciò è stato elaborato un modello nullo che provasse a rendere conto di questa discrepanza, imputandone la causa a mutazioni casuali di una singola base azotata. Il modello è stato applicato ai dinucleotidi di Homo sapiens e dai risultati è emerso che solo le distribuzioni AT e TA risultano simili a quella dei CG e che il processo è irreversibile. Infine si è visto che rappresentando il parametro di scala della distribuzione gamma, ricavato dal fit, in funzione del paramtero di forma, è stato possibile distringuere le diverse classi di organismi, sia per i dati di partenza che per un set più ampio; inoltre, i risultati mostrano l'esistenza di una relazione lineare tra il parametro di scala e la percentuale di CG presenti nella sequenza analizzata, se rappresentati in scala doppio logaritmica. Lo studio svolto ha dunque confermato l'esistenza di una relazione tra la posizione occupata dai CG nei genomi e la funzione biologica da essi svolta.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Merlotti, Alessandra
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum E: Fisica applicata
Ordinamento Cds
DM270
Parole chiave
CG,methylation,multiple organisms,dinucleotides,interdistances,DNA sequence analysis,statistical analysis
Data di discussione della Tesi
29 Marzo 2017
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Merlotti, Alessandra
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum E: Fisica applicata
Ordinamento Cds
DM270
Parole chiave
CG,methylation,multiple organisms,dinucleotides,interdistances,DNA sequence analysis,statistical analysis
Data di discussione della Tesi
29 Marzo 2017
URI
Statistica sui download
Gestione del documento: