Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Condividi allo stesso modo 4.0 (CC BY-NC-SA 4.0) Download (860kB) |
Abstract
Questa tesi si concentra sull'analisi della decomposizione CUR, considerata sia come fattorizzazione esatta che come approssimazione a rango basso, e sulla sua applicazione al problema del Subspace Clustering. La decomposizione CUR consente di rappresentare una matrice di dati selezionando alcune delle sue righe e colonne più rappresentative, permettendo così la riduzione dimensionale e mantenendo l'interpretabilità dei risultati. Nella prima parte, vengono discussi i fondamenti teorici della decomposizione CUR, inclusa la pseudo-inversa di Moore-Penrose. Si evidenziano poi le proprietà matematiche della decomposizione CUR e il suo utilizzo nel contesto del Subspace Clustering, un problema centrale nell'analisi dei dati in cui i punti dati appartengono a sottospazi lineari distinti. Viene presentato un algoritmo che costruisce matrici di similarità tramite la decomposizione CUR e permette di individuare correttamente i cluster di sottospazi anche nel caso di dati con rumore. Inoltre viene proposto un algoritmo di clustering basato sulle coordinate principali, il Principal Coordinate Clustering. Le applicazioni pratiche trattate includono la segmentazione del moto e il riconoscimento facciale. Per la segmentazione del moto, viene utilizzato il dataset Hopkins155, dimostrando la capacità dell'algoritmo di separare correttamente oggetti in movimento all'interno di una scena. Nel caso del riconoscimento facciale, il Database of Faces viene impiegato per testare l'efficacia della decomposizione CUR nel migliorare l'accuratezza del riconoscimento e nel ridurre la dimensione dei dati, mantenendo le caratteristiche essenziali per distinguere i volti. I risultati ottenuti mostrano che la decomposizione CUR è un metodo efficace e versatile per la gestione di dati complessi e il clustering.