Documenti full-text disponibili:
Abstract
Nell'ambito del machine learning, gli alberi decisionali (DTs, Decision Trees) rappresentano un importante strumento di apprendimento supervisionato per la classificazione e la regressione. Questi modelli, caratterizzati da una struttura ad albero, offrono un'elevata interpretabilità e sono ampiamente usati per la loro capacità di fornire predizioni accurate e comprensibili.
Questo studio si concentra sull'analisi comparativa di tre algoritmi di induzione degli alberi decisionali: Classification and Regression Trees (CART), Optimal Classification Trees (OCT), e MurTree (MT). CART, un algoritmo euristico, ha dimostrato un'ottima efficienza, ma, anche, una tendenza al sovraadattamento. Al contrario, OCT e MT, algoritmi ottimali, si distinguono per la capacità di generare alberi decisionali con maggiore accuratezza e minore complessità.
Attraverso il lavoro svolto, che ha richiesto fra l’altro l’estensione del codice sorgete di repository pubblici e l’interazione con aziende che commercializzano alcuni dei codici, emerge che OCT e MT tendono a generare alberi con una maggiore precisione rispetto a CART. Inoltre, OCT si distingue per la sua capacità di ridurre la complessità degli alberi, mentre MT si focalizza sull'ottimizzazione globale.
Questo studio fornisce una panoramica dettagliata delle prestazioni e della complessità dei DTs elaborati da questi algoritmi, dimostrando che la scelta del metodo di induzione impatta significativamente sulle prestazioni e sull'interpretabilità degli alberi decisionali. Le conclusioni traggono spunti importanti per la selezione degli algoritmi in base alle esigenze specifiche dell'applicazione.
Abstract
Nell'ambito del machine learning, gli alberi decisionali (DTs, Decision Trees) rappresentano un importante strumento di apprendimento supervisionato per la classificazione e la regressione. Questi modelli, caratterizzati da una struttura ad albero, offrono un'elevata interpretabilità e sono ampiamente usati per la loro capacità di fornire predizioni accurate e comprensibili.
Questo studio si concentra sull'analisi comparativa di tre algoritmi di induzione degli alberi decisionali: Classification and Regression Trees (CART), Optimal Classification Trees (OCT), e MurTree (MT). CART, un algoritmo euristico, ha dimostrato un'ottima efficienza, ma, anche, una tendenza al sovraadattamento. Al contrario, OCT e MT, algoritmi ottimali, si distinguono per la capacità di generare alberi decisionali con maggiore accuratezza e minore complessità.
Attraverso il lavoro svolto, che ha richiesto fra l’altro l’estensione del codice sorgete di repository pubblici e l’interazione con aziende che commercializzano alcuni dei codici, emerge che OCT e MT tendono a generare alberi con una maggiore precisione rispetto a CART. Inoltre, OCT si distingue per la sua capacità di ridurre la complessità degli alberi, mentre MT si focalizza sull'ottimizzazione globale.
Questo studio fornisce una panoramica dettagliata delle prestazioni e della complessità dei DTs elaborati da questi algoritmi, dimostrando che la scelta del metodo di induzione impatta significativamente sulle prestazioni e sull'interpretabilità degli alberi decisionali. Le conclusioni traggono spunti importanti per la selezione degli algoritmi in base alle esigenze specifiche dell'applicazione.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Deniku, Ezmiron
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
machine learning,alberi decisionali,classificazione
Data di discussione della Tesi
30 Novembre 2023
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Deniku, Ezmiron
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
machine learning,alberi decisionali,classificazione
Data di discussione della Tesi
30 Novembre 2023
URI
Statistica sui download
Gestione del documento: