Scala, Simone
 
(2017)
Realizzazione di un motore di ricerca semantico basato sui Document Embedding.
[Laurea magistrale], Università di Bologna, Corso di Studio in 
Informatica [LM-DM270], Documento full-text non disponibile
  
 
  
  
        
        
	
  
  
  
  
  
  
  
    
      Il full-text non è disponibile per scelta dell'autore.
      
        (
Contatta l'autore)
      
    
  
    
  
  
    
      Abstract
      Il presente elaborato propone lo sviluppo di un motore di ricerca semantico in grado di estrapolare contenuti all'interno di una vasta gamma di informazioni testuali. Verranno definite delle tecniche di ricerca capaci di interpretare il significato contestuale di interrogazioni formulate in linguaggio naturale.
Il metodo impiegato per effettuare le suddette ricerche si basa sull'analisi semantica distribuzionale, argomento di rilevante impatto nel campo dell’elaborazione del linguaggio naturale. 
Uno dei più recenti sviluppi in tale ambito ha portato alla formulazione di metodi noti in letteratura come Document Embedding fino a ottenere, con Paragraph Vector e tecnologie  affini,  la  possibilità  di  mappare  semanticamente  intere porzioni di testo.  Questi sviluppi aprono nuove possibilità legate all'implementazione di nuove tecniche su cui strutturare i motori di ricerca.
Il contributo sarà quindi quello di realizzare un innovativo sistema di question answering (QA) basato sul modello semantico vettoriale di Document Embedding,  in grado di rispondere automaticamente a una domanda espressa in linguaggio naturale. L'esperimento sarà condotto su un corpus di testi proveniente da Wikipedia. L'efficacia di questo sistema sarà poi misurata in maniera sperimentale considerando un test set di domande casuali (inerenti il corpus) che potrebbero essere poste a un motore di ricerca. I risultati che affioreranno da tale analisi mostreranno come i modelli di Document Embedding siano effettivamente idonei allo scopo prefissato.
     
    
      Abstract
      Il presente elaborato propone lo sviluppo di un motore di ricerca semantico in grado di estrapolare contenuti all'interno di una vasta gamma di informazioni testuali. Verranno definite delle tecniche di ricerca capaci di interpretare il significato contestuale di interrogazioni formulate in linguaggio naturale.
Il metodo impiegato per effettuare le suddette ricerche si basa sull'analisi semantica distribuzionale, argomento di rilevante impatto nel campo dell’elaborazione del linguaggio naturale. 
Uno dei più recenti sviluppi in tale ambito ha portato alla formulazione di metodi noti in letteratura come Document Embedding fino a ottenere, con Paragraph Vector e tecnologie  affini,  la  possibilità  di  mappare  semanticamente  intere porzioni di testo.  Questi sviluppi aprono nuove possibilità legate all'implementazione di nuove tecniche su cui strutturare i motori di ricerca.
Il contributo sarà quindi quello di realizzare un innovativo sistema di question answering (QA) basato sul modello semantico vettoriale di Document Embedding,  in grado di rispondere automaticamente a una domanda espressa in linguaggio naturale. L'esperimento sarà condotto su un corpus di testi proveniente da Wikipedia. L'efficacia di questo sistema sarà poi misurata in maniera sperimentale considerando un test set di domande casuali (inerenti il corpus) che potrebbero essere poste a un motore di ricerca. I risultati che affioreranno da tale analisi mostreranno come i modelli di Document Embedding siano effettivamente idonei allo scopo prefissato.
     
  
  
    
    
      Tipologia del documento
      Tesi di laurea
(Laurea magistrale)
      
      
      
      
        
      
        
          Autore della tesi
          Scala, Simone
          
        
      
        
          Relatore della tesi
          
          
        
      
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
          Indirizzo
          Curriculum A: Linguaggi e fondamenti
          
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          Semantica,Elaborazione del linguaggio natuale,Motore di ricerca
          
        
      
        
          Data di discussione della Tesi
          20 Dicembre 2017
          
        
      
      URI
      
      
     
   
  
    Altri metadati
    
      Tipologia del documento
      Tesi di laurea
(NON SPECIFICATO)
      
      
      
      
        
      
        
          Autore della tesi
          Scala, Simone
          
        
      
        
          Relatore della tesi
          
          
        
      
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
          Indirizzo
          Curriculum A: Linguaggi e fondamenti
          
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          Semantica,Elaborazione del linguaggio natuale,Motore di ricerca
          
        
      
        
          Data di discussione della Tesi
          20 Dicembre 2017
          
        
      
      URI
      
      
     
   
  
  
  
  
  
  
    
      Gestione del documento: 
      
        