On code stylometry: authorship attribution of source codesnippets

Balla, Stefano (2021) On code stylometry: authorship attribution of source codesnippets. [Laurea magistrale], Università di Bologna, Corso di Studio in Informatica [LM-DM270], Documento ad accesso riservato.
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Full-text accessibile solo agli utenti istituzionali dell'Ateneo
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (1MB) | Contatta l'autore

Abstract

The subject of stylometry has long been addressed in the world of natural language. In recent decades, this concept has also begun to be considered in source code, trying to identify programming style. In this research, an innovative method for code representation is proposed. Thanks to this method it is then demonstrated how it is possible through a neural model called code2vec, to make author recognition of small pieces of source code. Finally, it is also shown how some tools widely used in the field of software engineering, autoformatters in this case, influence the stylistic contribution.

Abstract
Tipologia del documento
Tesi di laurea (Laurea magistrale)
Autore della tesi
Balla, Stefano
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Indirizzo
Curriculum B: Informatica per il management
Ordinamento Cds
DM270
Parole chiave
Machine Learning,Software Engineering,Stylometry
Data di discussione della Tesi
13 Ottobre 2021
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^