Martignano, Alessandro
(2019)
Transfer learning nella classificazione di dati testuali gerarchici:
approcci semantici basati su ontologie e word embeddings.
[Laurea], Università di Bologna, Corso di Studio in
Ingegneria e scienze informatiche [L-DM270] - Cesena, Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Nell'era dell'informatizzazione e con l'avvento del web semantico vi è una sempre crescente necessità di classificare e organizzare grandi moli di dati non strutturati posti in linguaggio naturale al fine di poter trarre da essi informazioni utili alla costruzione di una conoscenza. Tuttavia l'analisi e la classificazione di tali tipi di dati rappresenta, per un sistema automatico, un problema non triviale quanto per un essere umano. A tale scopo in tempi odierni assistiamo a una larga diffusione di tecniche di natural language processing, text mining e sentiment analysis grazie anche ai recenti importanti sviluppi nel campo del machine learning. L'obiettivo che questo elaborato si pone è quello di presentare un approccio alternativo alla classificazione automatica di documenti in categorie gerarchiche di argomenti basato sulle relazioni semantiche che intercorrono tra le parole che compongono gli stessi. Tali relazioni vengono attinte da una base di conoscenza semantica mediante algoritmi sviluppati appositamente, rendendo così la determinazione del grado di correlazione completamente indipendente dagli argomenti usati per l'addestramento e persino dalla lingua. Il modello proposto si differenzia da quelli presenti in letteratura classica per le sue caratteristiche di riusabilità e generalizzazione grazie alle quali è in grado di operare, in fase di classificazione, anche su tematiche e categorie non conosciute in fase di addestramento.
Abstract
Nell'era dell'informatizzazione e con l'avvento del web semantico vi è una sempre crescente necessità di classificare e organizzare grandi moli di dati non strutturati posti in linguaggio naturale al fine di poter trarre da essi informazioni utili alla costruzione di una conoscenza. Tuttavia l'analisi e la classificazione di tali tipi di dati rappresenta, per un sistema automatico, un problema non triviale quanto per un essere umano. A tale scopo in tempi odierni assistiamo a una larga diffusione di tecniche di natural language processing, text mining e sentiment analysis grazie anche ai recenti importanti sviluppi nel campo del machine learning. L'obiettivo che questo elaborato si pone è quello di presentare un approccio alternativo alla classificazione automatica di documenti in categorie gerarchiche di argomenti basato sulle relazioni semantiche che intercorrono tra le parole che compongono gli stessi. Tali relazioni vengono attinte da una base di conoscenza semantica mediante algoritmi sviluppati appositamente, rendendo così la determinazione del grado di correlazione completamente indipendente dagli argomenti usati per l'addestramento e persino dalla lingua. Il modello proposto si differenzia da quelli presenti in letteratura classica per le sue caratteristiche di riusabilità e generalizzazione grazie alle quali è in grado di operare, in fase di classificazione, anche su tematiche e categorie non conosciute in fase di addestramento.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Martignano, Alessandro
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
text mining,natural language processing,text classification,hierarchical text classification,word embeddings,machine learning,sentiment analysis,transfer learning
Data di discussione della Tesi
21 Marzo 2019
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Martignano, Alessandro
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum ingegneria informatica
Ordinamento Cds
DM270
Parole chiave
text mining,natural language processing,text classification,hierarchical text classification,word embeddings,machine learning,sentiment analysis,transfer learning
Data di discussione della Tesi
21 Marzo 2019
URI
Gestione del documento: