Raccolta di dati su LinkedIn: analisi delle API e uso di web scraper

Berni, Samuele (2023) Raccolta di dati su LinkedIn: analisi delle API e uso di web scraper. [Laurea], Università di Bologna, Corso di Studio in Informatica per il management [L-DM270]
Documenti full-text disponibili:
[img] Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato

Download (907kB)

Abstract

L’idea della tesi nasce da un’esigenza evidenziata dal progetto RI-PLASMA, un progetto finanziato dall’Università di Bologna che ha l’obbiettivo di studiare gli spillover tecnologici dei lavori di ricerca. Questa tesi ha lo scopo di eseguire uno studio di fattibilità sulle API LinkedIn e sui web scrapers utilizzabili per ottenere dati sulla biografia e sulla produzione scientifica di Principal Investigator di progetti europei. In particolare cercherò, se presenti, gli articoli da loro pubblicati sulla piattaforma LinkedIn con gli strumenti forniti dal social in questione o attraverso altri mezzi. LinkedIn è uno dei social network più diffusi al mondo nell’ambito business, dove è possibile trovare offerte e opportunità di lavoro, pubblicare annunci e ricercare potenziali candidati. Gli utenti del social hanno la possibilità di creare profili visualizzabili da altre persone iscritte e non alla piattaforma. L’API di LinkedIn, per numerosi problemi di data breach causati da una sua vulnerabilità, non è utile allo scopo in quanto gli amministratori del social hanno deciso di limitarne notevolmente l’accesso. La tesi ha quindi studiato l'eventuale uso di web scraper in questo contesto. Il web scraping è una tecnica informatica utilizzata per l’estrazione di dati da un sito web attraverso l’utilizzo di programmi software. Una volta ottenuto l’URL del profilo bisognerà estrapolare gli articoli pubblicati dal soggetto interessato; sarà quindi necessario utilizzare un API che con il link ottenuto in precedenza dallo scraper potrà inoltrare tutte le informazioni richieste. Dopo aver eseguito un’analisi sui software, valutando quindi l’utilità e il prezzo, verranno studiati anche gli aspetti legali sull’utilizzo di queste piattaforme.

Abstract
Tipologia del documento
Tesi di laurea (Laurea)
Autore della tesi
Berni, Samuele
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
LinkedIn,RI-PLASMA,API,Scraper,PhantomBuster
Data di discussione della Tesi
14 Marzo 2023
URI

Altri metadati

Statistica sui download

Gestione del documento: Visualizza il documento

^