最近做了一个客户分析,想了好久,最终也没做出有啥技术含量的东东,其中用了一下聚类分析,感觉还算是体现了那么一点点的统计学的专业性,看了各位大神写的精华神贴,今天也来分享一下,希望高手指点~
元数据为19个客户的∑订单数、∑订单额,现在需要根据客户采购规模的大小进行分类。
思路:首先制作散点图,来看一下大致的分布情况(使用Excel),如下图:
从上图可以看出:客户J、G、S、Q属于订单数量少,订单金额小的一类,客户D属于订单数量大,订单金额大的一类,客户K、O属于订单数量较大,但是订单金额却不怎么大的一类,中间的部分我们也能大致分类,但是并不能分的很清楚,为了严谨期间我们用SPSS做验证。
在做SPSS聚类之前,补充一点,上面的散点图中我们可以明显的看出散点分布在一个斜向上的数据带上,总的来看订单数量越大,订单金额就越大。Excel散点图的做法参考了刘万祥老师的《Excel图表之道》一书,在此也推荐一下此书,对图表制作的讲解非常独到,同时用到了批量增加标签的插件XY Chart Labeler,用来批量添加指定的标签。
SPSS19.0中文版的做法:分析→分类→系统聚类,运行得到树状图如下:
可以看出:客户G、S、J、Q首先聚为了一类,客户A、M、F、H、L、R为一类,客户K、O为一类,客户D为一类,其余的几个客户比较相近,个别非常相近,可以自行分类。Ps:以上制作参照了《步入职场第一步-SPSS统计分析与应用》一书,此书结构清晰,语言通俗易懂,推荐一下。
综上,我们可以更换客户的指标进行聚类,一般是首先作图来看一下大致的分布情况,再用统计理论进行验证,得出聚类结果,通过以上两个步骤,我们即得到了直观的图表,又进行了专业的验证,可以向专业人士/非专业人士交差了~
相关数据及工具请见附件,欢迎大家指点~