Trombi, Francesco
(2017)
Metodi per il Topic Detection su Twitter.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Informatica [LM-DM270]
Documenti full-text disponibili:
|
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (2MB)
|
Abstract
Questo lavoro di tesi si pone l'obiettivo di mostrare l'implementazione di una soluzione al problema del topic detection su Twitter, da inserire all'interno di una suite software open source per la Business Analysis. Viene fornita una panoramica sui metodi che possono essere utilizzati per svolgere il task di topic detection, con particolare attenzione alla descrizione di quelli che compongono la soluzione presentata. Tale soluzione utilizza l'algoritmo Paragraph Vector per addestrare un modello in grado di trasformare i tweet in vettori, e l'algoritmo di clustering HDBSCAN per suddividere i vettori nei diversi topic.
Abstract
Questo lavoro di tesi si pone l'obiettivo di mostrare l'implementazione di una soluzione al problema del topic detection su Twitter, da inserire all'interno di una suite software open source per la Business Analysis. Viene fornita una panoramica sui metodi che possono essere utilizzati per svolgere il task di topic detection, con particolare attenzione alla descrizione di quelli che compongono la soluzione presentata. Tale soluzione utilizza l'algoritmo Paragraph Vector per addestrare un modello in grado di trasformare i tweet in vettori, e l'algoritmo di clustering HDBSCAN per suddividere i vettori nei diversi topic.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Trombi, Francesco
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum B: Informatica per il management
Ordinamento Cds
DM270
Parole chiave
topic detection,twitter,paragraph vector,clustering,HDBSCAN,apprendimento automatico
Data di discussione della Tesi
20 Dicembre 2017
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Trombi, Francesco
Relatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum B: Informatica per il management
Ordinamento Cds
DM270
Parole chiave
topic detection,twitter,paragraph vector,clustering,HDBSCAN,apprendimento automatico
Data di discussione della Tesi
20 Dicembre 2017
URI
Statistica sui download
Gestione del documento: