Bevilacqua, Francesca
(2017)
Rappresentazione in dimensioni ridotte di documenti mediante i centroidi e i minimi quadrati.
[Laurea], Università di Bologna, Corso di Studio in
Matematica [L-DM270]
Documenti full-text disponibili:
Abstract
Questo elaborato ha l'obiettivo di presentare alcuni metodi di riduzione di dimensione mediante fattorizzazione di matrici. In particolare ci si soffermerà sulla riduzione di dimensione di documenti: essi vengono rappresentati come vettori le cui componenti contano le occorrenze di un termine all'interno del documento. Oltre ai metodi classici, si introdurranno due metodi recenti di riduzione e un algoritmo di classificazione che tengono conto della conoscenza a priori dei dati. L'importanza di una buona riduzione di dimensione è legata all'estrapolazione di informazioni da grandi moli di dati; in essa il maggior costo computazionale è dato dal confronto tra due documenti/vettori. Si vogliono quindi ridurre le dimensioni
dei vettori senza perdere troppe informazioni su di essi.
Si considereranno set di dati con una struttura di cluster e ci si soffermerà sulla loro riduzione ai fini di una corretta classificazione.
Abstract
Questo elaborato ha l'obiettivo di presentare alcuni metodi di riduzione di dimensione mediante fattorizzazione di matrici. In particolare ci si soffermerà sulla riduzione di dimensione di documenti: essi vengono rappresentati come vettori le cui componenti contano le occorrenze di un termine all'interno del documento. Oltre ai metodi classici, si introdurranno due metodi recenti di riduzione e un algoritmo di classificazione che tengono conto della conoscenza a priori dei dati. L'importanza di una buona riduzione di dimensione è legata all'estrapolazione di informazioni da grandi moli di dati; in essa il maggior costo computazionale è dato dal confronto tra due documenti/vettori. Si vogliono quindi ridurre le dimensioni
dei vettori senza perdere troppe informazioni su di essi.
Si considereranno set di dati con una struttura di cluster e ci si soffermerà sulla loro riduzione ai fini di una corretta classificazione.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Bevilacqua, Francesca
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
riduzione dimensioni cluster classificazione centroidi ortogonali matrici termini-documenti minimi quadrati svd estrazione di informazioni decomposizioni di rango basso
Data di discussione della Tesi
27 Ottobre 2017
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Bevilacqua, Francesca
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
riduzione dimensioni cluster classificazione centroidi ortogonali matrici termini-documenti minimi quadrati svd estrazione di informazioni decomposizioni di rango basso
Data di discussione della Tesi
27 Ottobre 2017
URI
Statistica sui download
Gestione del documento: