Napoletano, Gabriele
(2025)
Analisi e previsione dei tempi in mezza maratona basate su dati raccolti tramite questionario.
[Laurea], Università di Bologna, Corso di Studio in
Informatica per il management [L-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Questa tesi ha lo scopo di analizzare e prevedere i tempi in mezza maratona a partire da un questionario su abitudini di allenamento e caratteristiche fisiche. Dopo la pulizia del dataset, ricavato dalle risposte al questionario, è stata condotta un’analisi esplorativa per individuare le variabili più influenti sul tempo finale.
Inoltre, sono state confrontate le diverse metodologie di allenamento tra gli atleti più veloci e i più lenti presenti nel campione.
Per la previsione sono stati valutati diversi modelli: LinearRegression, Ridge, Lasso, ElasticNet, RandomForest, GradientBoosting, XGBoost, SVR con kernel rbf e poly.
I modelli con iperparametri sono stati ottimizzati tramite ricerca in cross-validation con seed fisso. La valutazione si è basata principalmente sul MAE e RMSE, ma anche sull'indice R2.
Per quantificare l’incertezza dei risultati sono stati ripetuti più split casuali train/test e calcolati intervalli di confidenza al 95% delle metriche.
Modelli più complessi, come quelli non lineari, non hanno mostrato benefici stabili, verosimilmente a causa delle dimensioni ridotte del campione.
In futuro, l'ampliamento del dataset e l'inclusione di ulteriori variabili possono sicuramente migliorare l'accuratezza predittiva.
Abstract
Questa tesi ha lo scopo di analizzare e prevedere i tempi in mezza maratona a partire da un questionario su abitudini di allenamento e caratteristiche fisiche. Dopo la pulizia del dataset, ricavato dalle risposte al questionario, è stata condotta un’analisi esplorativa per individuare le variabili più influenti sul tempo finale.
Inoltre, sono state confrontate le diverse metodologie di allenamento tra gli atleti più veloci e i più lenti presenti nel campione.
Per la previsione sono stati valutati diversi modelli: LinearRegression, Ridge, Lasso, ElasticNet, RandomForest, GradientBoosting, XGBoost, SVR con kernel rbf e poly.
I modelli con iperparametri sono stati ottimizzati tramite ricerca in cross-validation con seed fisso. La valutazione si è basata principalmente sul MAE e RMSE, ma anche sull'indice R2.
Per quantificare l’incertezza dei risultati sono stati ripetuti più split casuali train/test e calcolati intervalli di confidenza al 95% delle metriche.
Modelli più complessi, come quelli non lineari, non hanno mostrato benefici stabili, verosimilmente a causa delle dimensioni ridotte del campione.
In futuro, l'ampliamento del dataset e l'inclusione di ulteriori variabili possono sicuramente migliorare l'accuratezza predittiva.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Napoletano, Gabriele
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Mezza Maratona,Regressione,Previsione,Analisi Dati,Regolarizzazione,Questionario
Data di discussione della Tesi
29 Ottobre 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Napoletano, Gabriele
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Mezza Maratona,Regressione,Previsione,Analisi Dati,Regolarizzazione,Questionario
Data di discussione della Tesi
29 Ottobre 2025
URI
Gestione del documento: