Senatore, Alice
(2025)
pca e clustering applicati a un dataset sul nuoto.
[Laurea], Università di Bologna, Corso di Studio in
Matematica [L-DM270]
Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (2MB)
|
Abstract
La finalità di questa tesi è duplice.
Da un lato presentare teoricamente gli strumenti utilizzati: nel secondo capitolo si introduce l’algoritmo di PCA, le metodologie di scelta delle componenti principali e la loro interpretazione grafica; nel terzo capitolo si analizzano le tecniche di clustering, concentrandosi in particolare sul Complete Linkage per i metodi gerarchici e sulle K-medie per quelli non gerarchici, con relative interpretazioni grafiche.
Dall’altro lato applicare questi strumenti: nel quarto capitolo viene fatta un’analisi su un dataset reale relativo al nuoto agonistico, fornito da un dottorando del Dipartimento di Scienze per la Qualità della Vita. Il dataset analizzato comprende un ampio insieme di variabili antropometriche e prestative, rilevate su nuotatori e nuotatrici di età, proporzioni fisiche e stili di nuoto più efficaci differenti e, dal momento in cui non tutti i soggetti presentano dati completi, l’analisi viene svolta in due fasi: su un dataset ristretto, ottenuto selezionando solo gli individui con tutte le variabili nello stile libero disponibili; sul dataset completo, affrontando il problema dei dati mancanti con metodi adeguati.
Abstract
La finalità di questa tesi è duplice.
Da un lato presentare teoricamente gli strumenti utilizzati: nel secondo capitolo si introduce l’algoritmo di PCA, le metodologie di scelta delle componenti principali e la loro interpretazione grafica; nel terzo capitolo si analizzano le tecniche di clustering, concentrandosi in particolare sul Complete Linkage per i metodi gerarchici e sulle K-medie per quelli non gerarchici, con relative interpretazioni grafiche.
Dall’altro lato applicare questi strumenti: nel quarto capitolo viene fatta un’analisi su un dataset reale relativo al nuoto agonistico, fornito da un dottorando del Dipartimento di Scienze per la Qualità della Vita. Il dataset analizzato comprende un ampio insieme di variabili antropometriche e prestative, rilevate su nuotatori e nuotatrici di età, proporzioni fisiche e stili di nuoto più efficaci differenti e, dal momento in cui non tutti i soggetti presentano dati completi, l’analisi viene svolta in due fasi: su un dataset ristretto, ottenuto selezionando solo gli individui con tutte le variabili nello stile libero disponibili; sul dataset completo, affrontando il problema dei dati mancanti con metodi adeguati.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Senatore, Alice
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
correlazione,PCA,clustering,Complete LInkage,K-medie,covarianza,dataset,varianza,dendrogramma,grafico di dispersione,autovalore,distanza,cluster,dati mancanti,O-ALS
Data di discussione della Tesi
19 Dicembre 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Senatore, Alice
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
correlazione,PCA,clustering,Complete LInkage,K-medie,covarianza,dataset,varianza,dendrogramma,grafico di dispersione,autovalore,distanza,cluster,dati mancanti,O-ALS
Data di discussione della Tesi
19 Dicembre 2025
URI
Statistica sui download
Gestione del documento: