Studio del meccanismo di attenzione nelle reti neurali artificiali tramite self-supervised learning

Santoro, Simone (2023) Studio del meccanismo di attenzione nelle reti neurali artificiali tramite self-supervised learning. [Laurea], Università di Bologna, Corso di Studio in Fisica [L-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore. (Contatta l'autore)

Abstract

Oggigiorno le reti neurali e le intelligenze artificiali trovano innumerevoli campi di applicazione, quali possono essere la manipolazione di manoscritti, la traduzione automatica o la generazione di testo. Allo stesso modo, possono essere utilizzate per operare sulle immagini. Sono proprio le reti neurali in computer vision al centro degli studi di questa tesi. Queste, possono essere infatti addestrate al riconoscimento di oggetti e alla segmentazione di immagini, task che trovano fondamentali applicazioni alla diagnostica medica. É pertanto notevolmente utile, nonché di grande interesse scientifico, lo studio di tali modelli. In particolare, nell’ambito della computer vision sono largamente utilizzate le architetture di reti a convoluzione (CNN), tuttavia, il recente sviluppo del modello transformer, originariamente concepito per la manipolazione di testi e traduzioni, sta riscontrando ottimi risultati anche in questo campo. Pertanto, i transformer potrebbero essere in grado di competere con le ormai consolidate CNN. Il presente progetto di tesi ha riguardato lo studio delle principali architetture di reti neurali, a partire dal percettrone semplice, fino alla comprensione del modello transformer basato sul meccanismo di attenzione. Durante il lavoro, è stato utilizzato un modello SWIN transformer, completandone l’addestramento con il metodo self-supervised learning, quindi utilizzando un dataset non etichettato. L’addestramento è stato condotto utilizzando diversi set di parametri con l’obiettivo di determinare quelli che maggiormente minimizzano la funzione perdita in fase di validazione. Si è poi voluto condurre uno studio delle mappe di attenzione estratte dal modello, calcolando su di esse diverse metriche. In sintesi, lo scopo principale del progetto è lo studio del meccanismo di attenzione in un contesto self-supervised.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Santoro, Simone
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Reti neurali,Intelligenza artificiale,Transformer,Self-Attention,Segmentazione
Data di discussione della Tesi
24 Marzo 2023
URI

Altri metadati

Gestione del documento: Visualizza il documento

^