Kumawat, Nitesh
(2024)
Ricerca di parametri predittivi per la stima del valore
economico degli attaccanti nel gioco del calcio:
uno studio basato sulla regressione lineare.
[Laurea], Università di Bologna, Corso di Studio in
Informatica per il management [L-DM270], Documento ad accesso riservato.
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (4MB)
| Contatta l'autore
|
Abstract
Determinare il valore economico di un calciatore è un compito complesso, influenzato da fattori di vario tipo, inclusi quelli: prestazionali, di salute fisica, di natura commerciale e di contesto. Questa tesi esplora i principali parametri predittivi su cui potere basare algoritmicamente il valore di mercato delle punte centrali, usando come dati quelli delle principali leghe calcistiche europee (Serie A, Bundesliga, La Liga e Premier League) durante la stagione 2023-2024. Utilizzando come paragone i valori economici forniti da Transfermarkt e sviluppando opportuni modelli di regressione lineare, è stato mostrato come indicatori quali: gol totali, goal/partita ed, età siano sufficienti per stimare con accuratezza il valore di mercato di una punta centrale. Tuttavia, un passaggio chiave dell’analisi ha riguardato l’esclusione di alcuni outliers (fino a due per campionato) e l’applicazione di soglie progressive sui gol (>5, 6, 7, 8) per studiare l’andamento del coefficiente di determinazione (R^2). L’obiettivo di identificare il punto in cui l’accuratezza fornita dal modello raggiungeva il suo massimo è stato conseguito anche per merito dell’analisi dei valori standardizzati (z-values), da cui si è appunto determinato che i parametri predittivi più rilevanti, validi in tutti i campionati, sono il numero di gol totali, l’età e i gol a partita. In particolare, i risultati dimostrano un'elevata accuratezza del modello in Serie A e Bundesliga (R^2 oltre 0.9), mentre in La Liga e Premier League sono emerse alcune limitazioni, indicando la necessità di includere ulteriori variabili. L’analisi si inserisce nel progetto PRIN CATTSMM, finalizzato allo studio di dati e algoritmi in ambito sportivo. Sebbene lo studio si limiti a una sola stagione e a un ruolo specifico, suggerisce futuri sviluppi, come l’uso di modelli più complessi, ad esempio reti neurali artificiali, per ampliare la precisione delle previsioni e generalizzare i risultati a diverse categorie di calciatori.
Abstract
Determinare il valore economico di un calciatore è un compito complesso, influenzato da fattori di vario tipo, inclusi quelli: prestazionali, di salute fisica, di natura commerciale e di contesto. Questa tesi esplora i principali parametri predittivi su cui potere basare algoritmicamente il valore di mercato delle punte centrali, usando come dati quelli delle principali leghe calcistiche europee (Serie A, Bundesliga, La Liga e Premier League) durante la stagione 2023-2024. Utilizzando come paragone i valori economici forniti da Transfermarkt e sviluppando opportuni modelli di regressione lineare, è stato mostrato come indicatori quali: gol totali, goal/partita ed, età siano sufficienti per stimare con accuratezza il valore di mercato di una punta centrale. Tuttavia, un passaggio chiave dell’analisi ha riguardato l’esclusione di alcuni outliers (fino a due per campionato) e l’applicazione di soglie progressive sui gol (>5, 6, 7, 8) per studiare l’andamento del coefficiente di determinazione (R^2). L’obiettivo di identificare il punto in cui l’accuratezza fornita dal modello raggiungeva il suo massimo è stato conseguito anche per merito dell’analisi dei valori standardizzati (z-values), da cui si è appunto determinato che i parametri predittivi più rilevanti, validi in tutti i campionati, sono il numero di gol totali, l’età e i gol a partita. In particolare, i risultati dimostrano un'elevata accuratezza del modello in Serie A e Bundesliga (R^2 oltre 0.9), mentre in La Liga e Premier League sono emerse alcune limitazioni, indicando la necessità di includere ulteriori variabili. L’analisi si inserisce nel progetto PRIN CATTSMM, finalizzato allo studio di dati e algoritmi in ambito sportivo. Sebbene lo studio si limiti a una sola stagione e a un ruolo specifico, suggerisce futuri sviluppi, come l’uso di modelli più complessi, ad esempio reti neurali artificiali, per ampliare la precisione delle previsioni e generalizzare i risultati a diverse categorie di calciatori.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Kumawat, Nitesh
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Data Science,Regressione Lineare,Football Data Analysis
Data di discussione della Tesi
17 Dicembre 2024
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Kumawat, Nitesh
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Data Science,Regressione Lineare,Football Data Analysis
Data di discussione della Tesi
17 Dicembre 2024
URI
Statistica sui download
Gestione del documento: