Documenti full-text disponibili:
Abstract
La genomica è la disciplina che si occupa della struttura, sequenza, funzione ed evoluzione del genoma, cioè dell’informazione genetica contenuta nel DNA presente nelle cellule di una particolare specie.
Avendo a disposizione enormi quantità di dati per l'uomo diventa difficile poterli analizzare tutti e riuscire fare deduzioni su di essi.
Perciò fin dai primi anni di ricerca, in questa branca della biologia, si è resa fondamentale l'informatica per l'elaborazione e la visualizzazione dei dati che produce, tanto da poter affermare che si basa sulla bioinformatica.
Con l'accrescere dei dati raccolti dalle ricerche, è nata la necessità di catalogarli in modo ordinato all'interno di enormi database. Sono molteplici i progetti avviati con questo scopo, uno dei principali è Gene Ontology che mantiene e sviluppa un vocabolario controllato, e annota e diffonde dati riguardanti i geni e le loro funzioni.
È qui che entra in gioco il machine learning: grazie ai dati raccolti fino ad ora sulle funzioni biologiche svolte dai prodotti dei geni, e ai metodi introdotti dal machine learning come gli algoritmi supervisionati e le reti neurali, è ormai possibile aiutare la ricerca direzionando gli scienziati nelle analisi e negli esperimenti da provare, utili per scoprire e confermare nuove correlazioni tra geni e funzioni biologiche.
Inoltre, essendo tutti gli organismi legati dal punto di vista evolutivo, e quindi con un genoma più o meno simile, è possibile trasferire le conoscenze apprese da uno di essi ad un altro: questo è ciò che si intende per "Transfer Learning Inter-Organismo".
In questa tesi verranno sfruttate le reti neurali per trasferire queste conoscenze, proponendo due metodologie differenti: una utilizza la struttura degli autoencoder, l'altra invece crea classificatori differenti per ogni valore da predire usando il deep learning.
Abstract
La genomica è la disciplina che si occupa della struttura, sequenza, funzione ed evoluzione del genoma, cioè dell’informazione genetica contenuta nel DNA presente nelle cellule di una particolare specie.
Avendo a disposizione enormi quantità di dati per l'uomo diventa difficile poterli analizzare tutti e riuscire fare deduzioni su di essi.
Perciò fin dai primi anni di ricerca, in questa branca della biologia, si è resa fondamentale l'informatica per l'elaborazione e la visualizzazione dei dati che produce, tanto da poter affermare che si basa sulla bioinformatica.
Con l'accrescere dei dati raccolti dalle ricerche, è nata la necessità di catalogarli in modo ordinato all'interno di enormi database. Sono molteplici i progetti avviati con questo scopo, uno dei principali è Gene Ontology che mantiene e sviluppa un vocabolario controllato, e annota e diffonde dati riguardanti i geni e le loro funzioni.
È qui che entra in gioco il machine learning: grazie ai dati raccolti fino ad ora sulle funzioni biologiche svolte dai prodotti dei geni, e ai metodi introdotti dal machine learning come gli algoritmi supervisionati e le reti neurali, è ormai possibile aiutare la ricerca direzionando gli scienziati nelle analisi e negli esperimenti da provare, utili per scoprire e confermare nuove correlazioni tra geni e funzioni biologiche.
Inoltre, essendo tutti gli organismi legati dal punto di vista evolutivo, e quindi con un genoma più o meno simile, è possibile trasferire le conoscenze apprese da uno di essi ad un altro: questo è ciò che si intende per "Transfer Learning Inter-Organismo".
In questa tesi verranno sfruttate le reti neurali per trasferire queste conoscenze, proponendo due metodologie differenti: una utilizza la struttura degli autoencoder, l'altra invece crea classificatori differenti per ogni valore da predire usando il deep learning.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Giannini, Andrea
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
Reti Neurali,Autoencoder,Transfer Learning,Genomica,Machine Learning,Deep Learning,Gene Ontology
Data di discussione della Tesi
14 Dicembre 2018
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Giannini, Andrea
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
Reti Neurali,Autoencoder,Transfer Learning,Genomica,Machine Learning,Deep Learning,Gene Ontology
Data di discussione della Tesi
14 Dicembre 2018
URI
Statistica sui download
Gestione del documento: