Rappresentazione in dimensioni ridotte di documenti mediante i centroidi e i minimi quadrati

Bevilacqua, Francesca (2017) Rappresentazione in dimensioni ridotte di documenti mediante i centroidi e i minimi quadrati. [Laurea], Università di Bologna, Corso di Studio in Matematica [L-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Creative Commons: Attribuzione - Non commerciale - Non opere derivate 3.0 (CC BY-NC-ND 3.0)

Download (360kB)

Abstract

Questo elaborato ha l'obiettivo di presentare alcuni metodi di riduzione di dimensione mediante fattorizzazione di matrici. In particolare ci si soffermerà sulla riduzione di dimensione di documenti: essi vengono rappresentati come vettori le cui componenti contano le occorrenze di un termine all'interno del documento. Oltre ai metodi classici, si introdurranno due metodi recenti di riduzione e un algoritmo di classificazione che tengono conto della conoscenza a priori dei dati. L'importanza di una buona riduzione di dimensione è legata all'estrapolazione di informazioni da grandi moli di dati; in essa il maggior costo computazionale è dato dal confronto tra due documenti/vettori. Si vogliono quindi ridurre le dimensioni dei vettori senza perdere troppe informazioni su di essi. Si considereranno set di dati con una struttura di cluster e ci si soffermerà sulla loro riduzione ai fini di una corretta classificazione.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Bevilacqua, Francesca
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
riduzione dimensioni cluster classificazione centroidi ortogonali matrici termini-documenti minimi quadrati svd estrazione di informazioni decomposizioni di rango basso
Data di discussione della Tesi
27 Ottobre 2017
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^