Il clustering nell'information retrieval

Fusaroli Casadei, Chiara (2024) Il clustering nell'information retrieval. [Laurea], Università di Bologna, Corso di Studio in Matematica [L-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (663kB)

Abstract

La crescita esponenziale di Internet e l’avanzamento delle tecnologie hanno messo a disposizione una enorme quantità di dati in continuo aumento e aggiornamento. Questo va di pari passo con la necessità di metodi sempre più efficienti per ottenere informazioni utili da tali risorse disponibili. Negli anni si è dunque sviluppato il campo dell’Information Retrieval (IR), ovvero l’insieme delle tecniche di rappresentazione, memorizzazione, organizzazione dei dati e ricerca di informazioni, grazie alle quali può essere soddisfatto il bisogno informativo di un utente. L’elaborato si propone di applicare la cluster analysis all’information retrieval. Più precisamente, verrà trattata la rappresentazione vettoriale dei documenti e si spiegherà come alcune tecniche di clustering siano più adatte di altre in questo contesto (con una particolare attenzione per l’algoritmo delle k-medie sferiche), nonché come una suddivisione in cluster possa essere sfruttata per una più facile gestione di grandi moli di dati.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Fusaroli Casadei, Chiara
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Information Retrieval,IR,documenti,modello vettoriale,SVD,clustering,k-medie sferiche,centroidi,riduzione di dimensioni
Data di discussione della Tesi
28 Giugno 2024
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^