Predizione del bandgap nei solidi tramite XGBoost

Varisano, Andrea Maria (2025) Predizione del bandgap nei solidi tramite XGBoost. [Laurea], Università di Bologna, Corso di Studio in Fisica [L-DM270], Documento ad accesso riservato.
Documenti full-text disponibili:
[thumbnail of Thesis] Documento PDF (Thesis)
Full-text non accessibile fino al 31 Gennaio 2026.
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 4.0 (CC BY-NC-ND 4.0)

Download (743kB) | Contatta l'autore

Abstract

In questa tesi si sviluppa un modello di machine learning basato sull'algoritmo XGBoost per la previsione del bandgap stimato in approssimazione G₀W₀ nei solidi. Fra le proprietà dei materiali cristallini, il bandgap è sicuramente una delle più importanti per via delle sue applicazioni tecnologiche in settori in forte sviluppo come quello energetico ed elettronico. Essere in grado, dunque, di determinare con accuratezza il bandgap di un materiale è fondamentale. Tuttavia, sia l'approccio sperimentale che i metodi basati su calcoli a primi principi (come DFT e GW) presentano limitazioni significative. Quindi, viene qui proposto un approccio alternativo e innovativo al problema che prevede l'applicazione di algoritmi di Machine Learning, in grado di apprendere le complesse strutture che legano le proprietà chimico-fisiche dei materiali (raccolte in un unico database) e il loro bandgap in maniera più efficiente e meno onerosa in termini computazionali rispetto ai metodi tradizionali. XGBoost è stato addestrato su dataset contenenti diverse proprietà materiali, opportunamente selezionate. I risultati ottenuti mostrano che, utilizzando un dataset di 10 features, l'errore assoluto medio (MAE) sulla previsione del bandgap è di circa 0.50 eV sul test set. Questo risultato è significativamente migliore rispetto a quello ottenuto con dataset contenenti 5 features (MAE ≈ 0.56 eV) o solo proprietà DFT (MAE ≈ 0.54 eV), dimostrando l'importanza di avere un dataset contenente non solo proprietà DFT ma anche chimiche e strutturali. Viene anche leggermente migliorata la prestazione raggiunta con 15 features (MAE ≈ 0.51 eV), evidenziando l'efficacia di una selezione più oculata delle features, che permette di prevenire l'overfitting. Dall'analisi dell'importanza delle features emerge che il bandgap stimato tramite DFT e la costante dielettrica siano i descrittori più rilevanti, coerentemente con le aspettative fisiche.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Varisano, Andrea Maria
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
bandgap,DFT,GW,machine learning,XGBoost,ML
Data di discussione della Tesi
22 Luglio 2025
URI

Altri metadati

Gestione del documento: Visualizza il documento

^