Documenti full-text disponibili:
|
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (1MB)
|
Abstract
Il presente volume di tesi ha lo scopo di illustrare in modo approfondito i risultati ottenuti dalla comparazione di diversi algoritmi di Machine Learning, una branca fondamentale dell’intelligenza artificiale, per il riconoscimento delle emozioni nel parlato, noto come Speech Emotion Recognition (SER). Il linguaggio parlato è un modo naturale di comunicare tra gli esseri umani ed è anche un segnale complesso che trasporta una grande quantità di informazioni come pensieri, sentimenti, stati d'animo del parlante. Le macchine stanno diventando sempre più importanti in vari scenari per facilitare la vita quotidiana, l'industria, l'istruzione, l'intrattenimento e l'occupazione in una serie di campi. L’obiettivo principale di questo lavoro è quello di consolidare e arricchire le conoscenze nel campo del SER, fornendo una base solida per comprendere e valutare le metodologie più diffuse nel Machine Learning, applicate specificamente al problema del riconoscimento delle emozioni vocali. A tal fine, sono state adottate le tecniche più consolidate e riconosciute, come la Cross-validation e la Grid Search, che consentono rispettivamente di valutare l’efficacia dei modelli su dati non visti e di ottimizzare i parametri dei modelli in modo sistematico. In particolare, sono stati utilizzati i principali algoritmi applicati in questo settore, allo scopo di addestrare accuratamente i modelli e analizzare le loro prestazioni nella classificazione delle emozioni all'interno del dataset selezionato per l’addestramento. I risultati degli esperimenti hanno confermato un netto miglioramento delle performance rispetto alle tecniche basilari, con Gradient Boosting, che si è rivelato l’algoritmo più performante, ha ottenuto un’accuratezza di 0,4358.
Abstract
Il presente volume di tesi ha lo scopo di illustrare in modo approfondito i risultati ottenuti dalla comparazione di diversi algoritmi di Machine Learning, una branca fondamentale dell’intelligenza artificiale, per il riconoscimento delle emozioni nel parlato, noto come Speech Emotion Recognition (SER). Il linguaggio parlato è un modo naturale di comunicare tra gli esseri umani ed è anche un segnale complesso che trasporta una grande quantità di informazioni come pensieri, sentimenti, stati d'animo del parlante. Le macchine stanno diventando sempre più importanti in vari scenari per facilitare la vita quotidiana, l'industria, l'istruzione, l'intrattenimento e l'occupazione in una serie di campi. L’obiettivo principale di questo lavoro è quello di consolidare e arricchire le conoscenze nel campo del SER, fornendo una base solida per comprendere e valutare le metodologie più diffuse nel Machine Learning, applicate specificamente al problema del riconoscimento delle emozioni vocali. A tal fine, sono state adottate le tecniche più consolidate e riconosciute, come la Cross-validation e la Grid Search, che consentono rispettivamente di valutare l’efficacia dei modelli su dati non visti e di ottimizzare i parametri dei modelli in modo sistematico. In particolare, sono stati utilizzati i principali algoritmi applicati in questo settore, allo scopo di addestrare accuratamente i modelli e analizzare le loro prestazioni nella classificazione delle emozioni all'interno del dataset selezionato per l’addestramento. I risultati degli esperimenti hanno confermato un netto miglioramento delle performance rispetto alle tecniche basilari, con Gradient Boosting, che si è rivelato l’algoritmo più performante, ha ottenuto un’accuratezza di 0,4358.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Falconi, Eleonora
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Speech Emotion Recognition,Machine Learning,Fine-tuning,RAVDESS dataset
Data di discussione della Tesi
28 Novembre 2024
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Falconi, Eleonora
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Speech Emotion Recognition,Machine Learning,Fine-tuning,RAVDESS dataset
Data di discussione della Tesi
28 Novembre 2024
URI
Statistica sui download
Gestione del documento: