Cannizzaro, Sofia
(2019)
Regressione lineare e analisi delle componenti principali.
[Laurea], Università di Bologna, Corso di Studio in
Matematica [L-DM270]
Documenti full-text disponibili:
Abstract
Lo scopo dell’elaborato è di studiare la composizione di due metodi nel campo della statistica multivariata: l'analisi delle componenti principali e la regressione lineare multivariata.
Nel Capitolo 1 viene presentata l’analisi delle componenti principali (PCA), metodo che analizza e semplifica i dati e attraverso il quale si vuole spiegare la struttura di varianza-covarianza di un insieme di variabili, date poche combinazioni lineari di esse. Lo scopo è duplice: ridurre il numero di variabili necessarie a spiegare un fenomeno e renderlo di più̀ facile interpretazione. In seguito è stata discussa la regressione lineare multivariata, presentandone il modello e l'utilizzo del metodo dei minimi quadrati. In particolare si è rilevata l'importanza di scegliere il numero minore di variabili, che, tuttavia, mantenga la possibilità di un risultato attendibile; per questo sono state presentate alcune strategie per la selezione di variabili (come la regressione stepwise). Infine si è presentato il problema della riduzione del numero di variabili predittive mediante l'uso dell'analisi delle componenti principali. L’utilizzo della PCA permette di ridurre la dimensione del problema e, in particolare, di poterlo interpretare meglio e, quindi, determinare da quali variabili, anche non esplicitamente osservabili, dipende effettivamente la risposta.
Tramite un esempio è evidenziata l'importanza della scelta del numero di componenti principali nell'ambito della regressione.
Abstract
Lo scopo dell’elaborato è di studiare la composizione di due metodi nel campo della statistica multivariata: l'analisi delle componenti principali e la regressione lineare multivariata.
Nel Capitolo 1 viene presentata l’analisi delle componenti principali (PCA), metodo che analizza e semplifica i dati e attraverso il quale si vuole spiegare la struttura di varianza-covarianza di un insieme di variabili, date poche combinazioni lineari di esse. Lo scopo è duplice: ridurre il numero di variabili necessarie a spiegare un fenomeno e renderlo di più̀ facile interpretazione. In seguito è stata discussa la regressione lineare multivariata, presentandone il modello e l'utilizzo del metodo dei minimi quadrati. In particolare si è rilevata l'importanza di scegliere il numero minore di variabili, che, tuttavia, mantenga la possibilità di un risultato attendibile; per questo sono state presentate alcune strategie per la selezione di variabili (come la regressione stepwise). Infine si è presentato il problema della riduzione del numero di variabili predittive mediante l'uso dell'analisi delle componenti principali. L’utilizzo della PCA permette di ridurre la dimensione del problema e, in particolare, di poterlo interpretare meglio e, quindi, determinare da quali variabili, anche non esplicitamente osservabili, dipende effettivamente la risposta.
Tramite un esempio è evidenziata l'importanza della scelta del numero di componenti principali nell'ambito della regressione.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Cannizzaro, Sofia
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
regressione componenti multivariata principali riduzione interpretazione
Data di discussione della Tesi
27 Settembre 2019
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Cannizzaro, Sofia
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
regressione componenti multivariata principali riduzione interpretazione
Data di discussione della Tesi
27 Settembre 2019
URI
Statistica sui download
Gestione del documento: