Realizzazione di una infrastruttura di Opinion Mining per commenti testuali

Guardati, Simone (2019) Realizzazione di una infrastruttura di Opinion Mining per commenti testuali. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Milioni di commenti ogni giorno vengono scritti ed aggiunti su internet da migliaia di utenti, essi riguardano ristoranti, hotel, acquisti, luoghi da visitare e molto altro. Quotidianamente moltissime persone fano affidamento su tali opinioni, ad esempio preferendo l’acquisto di un prodotto rispetto ad un altro su un sito di e-commerce, rendendo così il valore di questi dati molto elevato ed una loro analisi un processo molto importante da effettuare. Estrarre le informazioni di interesse da essi è un procedimento difficilmente eseguibile da operatori umani data la loro enorme quantità, di conseguenza sarà necessario trovare dei sistemi informatici in grado di eseguire questo processo. Questo elaborato propone un’infrastruttura per eseguire il processo comunemente chiamato Aspect Based Sentiment Analysis (ABSA), il cui scopo finale sarà, dato un commento, estrarne le categorie da esso affrontate con le relative polarità. Ad esempio dal commento “buona la pizza ma il conto era alto” le categorie da estrarre potrebbero essere “gusto” e “prezzo” aventi rispettivamente polarità “positiva” e “negativa”. La nostra infrastruttura permetterà di personalizzare agilmente le sue componenti interne, lasciando all’utente la possibilità di aggiungere soluzioni proprie o di utilizzare quelle già implementate. Verranno inoltre sfruttati attivamente diversi servizi della Google Cloud Platform (GCP) grazie anche alla collaborazione con Injenia S.r.l., l’azienda dove è stato svolto il lavoro per questo elaborato. Il sistema è stato testato su due data set, uno dei quali preso dalla competizione italiana ABSITA, conclusa nel dicembre 2018. Le prestazioni su quest’ultimo data set hanno fornito un punteggio di F1-Score pari a 0.694, senza l’utilizzo di tecnologie specifiche al data set e ottimizzazione dei parametri. Tale punteggio avrebbe rappresentato un quinto posto alla competizione ABSITA.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Guardati, Simone
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Aspect Based Sentiment Analysis,Google Cloud Platform,Opinion Mining,Sentiment Analysis,Aspect Category Detection,Aspect Polarity Detection,Word Embedding,Natural Language Processing,ABSA,ACD,ACP,NLP
Data di discussione della Tesi
14 Marzo 2019
URI

Altri metadati

Gestione del documento: Visualizza il documento

^