Simulazione e studio del modello Broken stick per l'analisi di sequenze geniche

Edera, Andrea (2021) Simulazione e studio del modello Broken stick per l'analisi di sequenze geniche. [Laurea], Università di Bologna, Corso di Studio in Fisica [L-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (8MB)

Abstract

Alcuni risultati ottenuti studiando le proprietà statistiche dei dinucleotidi all'interno del DNA umano, mostrano che l'andamento delle distribuzioni delle interdistanze dei dinucleotidi TA è ben descritto da una legge di potenza. È stato ideato un modello in grado di generare un andamento di questo tipo e che potrebbe rendere conto del meccanismo generativo delle distribuzioni osservate all'interno della sequenza del DNA umano. Questo risulta essere una variante del modello Broken stick. Scopo di questa tesi è confrontare il modello Broken stick con la sua variante, che chiameremo Broken stick con memoria, in modo da valutarne analogie e differenze. Si sono implementati i due modelli ed è stata condotta un'analisi variando il numero di tagli iniziali e il numero di iterazioni, tenendo fisso il valore della probabilità di taglio. L'implementazione del modello ha messo in luce i limiti computazionali del programma utilizzato, Matlab, e ha mostrato che non è banale fittare le distribuzioni che si ottengono. Tagliando casualmente i segmenti si raggiunge un limite superato il quale il calcolatore non riesce più a distinguere gli estremi del segmento, generando così segmenti di lunghezza nulla. In questo modo non è possibile realizzare il modello così come è stato pensato, cioè in un dominio continuo in cui è possibile tagliare il segmento infinite volte. Di conseguenza la scelta delle condizioni iniziali non può essere arbitraria. Si sono studiate generazioni che hanno prodotto circa 1'000'000 di segmenti e si è visto che l'andamento descritto dai due modelli, a parità di condizioni iniziali, risulta differente. Il tipo di taglio iniziale determina una traslazione della distribuzione in scala log-log. Il modello Broken stick con memoria genera un andamento riconducibile ad una legge di potenza lungo tutto il range in cui viene rappresentata la distribuzione, a differenza di quello semplice che presenta effetti di cutoff sia in intervalli piccoli che grandi.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Edera, Andrea
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Broken stick,legge di potenza
Data di discussione della Tesi
19 Marzo 2021
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^