Di Marzo, Giuseppe
(2018)
Advanced Analytics per il Marketing: clustering dei clienti fidelizzati.
[Laurea magistrale], Università di Bologna, Corso di Studio in
Ingegneria informatica [LM-DM270], Documento full-text non disponibile
Il full-text non è disponibile per scelta dell'autore.
(
Contatta l'autore)
Abstract
Questo elaborato descrive un progetto di cluster analysis svolto in Iconsulting per un’azienda di fashion retail.
Lo scopo di questo progetto è clusterizzare i clienti fidelizzati dell’azienda di fashion retail e testare varie piattaforme che permettono analisi avanzate, in particolare il clustering.
Le clusterizzazioni sono state effettuate tramite il linguaggio R, sono stati sperimentati diversi algoritmi di clustering, tenendo in considerazione effcienza e qualità del risultato.
K-means è stato considerato il più adatto degli algoritmi sperimentati.
È stata svolta una piccola analisi sugli outliers, sempre utilizzando R, che ha portato a importanti riflessioni sul trattamento delle quantità monetarie.
È stata sviluppata ed implementata in R una metrica di qualità basata sul coeffciente di silhouette a complessità temporale lineare; tale metrica è stata utilizzata per scegliere, a partire da diverse clusterizzazioni effettuate con k-means e variando il numero di cluster, la clusterizzazione a qualità massima.
I clienti fidelizzati sono stati clusterizzati diverse volte considerando ogni volta diversi aspetti delle loro abitudini d’acquisto, data l’impossibilità di trattare il cliente al massimo livello di dettaglio.
Ogni clusterizzazione è stata realizzata applicando ripetutamente l’algoritmo k-means al dataset preparato variando il k da 2 a 10, scegliendo poi il risultato a qualità massima.
Le clusterizzazioni ottenute risultano soddisfacenti ed informative e verranno utilizzate per successive campagne di marketing e di CRM.
Abstract
Questo elaborato descrive un progetto di cluster analysis svolto in Iconsulting per un’azienda di fashion retail.
Lo scopo di questo progetto è clusterizzare i clienti fidelizzati dell’azienda di fashion retail e testare varie piattaforme che permettono analisi avanzate, in particolare il clustering.
Le clusterizzazioni sono state effettuate tramite il linguaggio R, sono stati sperimentati diversi algoritmi di clustering, tenendo in considerazione effcienza e qualità del risultato.
K-means è stato considerato il più adatto degli algoritmi sperimentati.
È stata svolta una piccola analisi sugli outliers, sempre utilizzando R, che ha portato a importanti riflessioni sul trattamento delle quantità monetarie.
È stata sviluppata ed implementata in R una metrica di qualità basata sul coeffciente di silhouette a complessità temporale lineare; tale metrica è stata utilizzata per scegliere, a partire da diverse clusterizzazioni effettuate con k-means e variando il numero di cluster, la clusterizzazione a qualità massima.
I clienti fidelizzati sono stati clusterizzati diverse volte considerando ogni volta diversi aspetti delle loro abitudini d’acquisto, data l’impossibilità di trattare il cliente al massimo livello di dettaglio.
Ogni clusterizzazione è stata realizzata applicando ripetutamente l’algoritmo k-means al dataset preparato variando il k da 2 a 10, scegliendo poi il risultato a qualità massima.
Le clusterizzazioni ottenute risultano soddisfacenti ed informative e verranno utilizzate per successive campagne di marketing e di CRM.
Tipologia del documento
Tesi di laurea
(Laurea magistrale)
Autore della tesi
Di Marzo, Giuseppe
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Clustering,CRM,Advanced Analytics,Fidelity,K-means,PAM,CLARA,DBSCAN,OPTICS,Clustering gerarchico,Silhouette,R,Azure Machine Learning,Dataiku DSS,RapidMiner,KNIME,Outlier
Data di discussione della Tesi
8 Febbraio 2018
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Di Marzo, Giuseppe
Relatore della tesi
Correlatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Clustering,CRM,Advanced Analytics,Fidelity,K-means,PAM,CLARA,DBSCAN,OPTICS,Clustering gerarchico,Silhouette,R,Azure Machine Learning,Dataiku DSS,RapidMiner,KNIME,Outlier
Data di discussione della Tesi
8 Febbraio 2018
URI
Gestione del documento: