Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (1MB)
|
Abstract
Il presente elaborato esplora l’applicazione del Machine Learning nella valutazione
del rischio di credito. L’obiettivo è individuare, attraverso tecniche di apprendimento
supervisionato, il modello più accurato per classificare i clienti in base al loro grado
di rischio. Sono stati analizzati e confrontati cinque algoritmi: Regressione Logistica,
Random Forest, Support Vector Machine con kernel RBF, Gradient Boosting e
K-Nearest Neighbors.
I modelli sono stati sviluppati in Python tramite la libreria scikit-learn, im-
piegando una pipeline completa di preprocessing, imputazione dei valori mancanti,
normalizzazione e ottimizzazione iperparametrica mediante GridSearchCV con vali-
dazione incrociata stratificata a 5 fold. Le prestazioni sono state valutate in termini
di accuratezza, precisione, recall, F1-score e AUC.
I risultati hanno evidenziato come la Regressione Logistica offra il miglior compro-
messo tra capacità predittiva e interpretabilità. L’impiego di strumenti di Explainable
AI , in particolare Shap, ha permesso di individuare le feature più rilevanti nella de-
terminazione del rischio, garantendo trasparenza e coerenza con i requisiti normativi
del settore creditizio.
Abstract
Il presente elaborato esplora l’applicazione del Machine Learning nella valutazione
del rischio di credito. L’obiettivo è individuare, attraverso tecniche di apprendimento
supervisionato, il modello più accurato per classificare i clienti in base al loro grado
di rischio. Sono stati analizzati e confrontati cinque algoritmi: Regressione Logistica,
Random Forest, Support Vector Machine con kernel RBF, Gradient Boosting e
K-Nearest Neighbors.
I modelli sono stati sviluppati in Python tramite la libreria scikit-learn, im-
piegando una pipeline completa di preprocessing, imputazione dei valori mancanti,
normalizzazione e ottimizzazione iperparametrica mediante GridSearchCV con vali-
dazione incrociata stratificata a 5 fold. Le prestazioni sono state valutate in termini
di accuratezza, precisione, recall, F1-score e AUC.
I risultati hanno evidenziato come la Regressione Logistica offra il miglior compro-
messo tra capacità predittiva e interpretabilità. L’impiego di strumenti di Explainable
AI , in particolare Shap, ha permesso di individuare le feature più rilevanti nella de-
terminazione del rischio, garantendo trasparenza e coerenza con i requisiti normativi
del settore creditizio.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Baldari, Cristian
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Explainable AI,Random Forest,SVM,Gradient Boosting,KNN,Regressione Logistica,Credit Risk,Default,Python
Data di discussione della Tesi
29 Ottobre 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Baldari, Cristian
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Explainable AI,Random Forest,SVM,Gradient Boosting,KNN,Regressione Logistica,Credit Risk,Default,Python
Data di discussione della Tesi
29 Ottobre 2025
URI
Statistica sui download
Gestione del documento: