请问一下有没有谁知道:SPSS k均值聚类中的初始聚类中心是怎么确定的?非常感谢

0
已邀请:
0

夏尔康 - 通晓各种统计学习方法,熟练使用R语言建模,结合帅气与才智的不明吃瓜群众 2016-07-25 回答

这儿可能得根据人工进行定义了,那根据业务去确定呢,例如,如果一堆客户订单数据,你要划分客户等级的话可能就会有多个类型,就要考虑多个不同的类别中心点,但是如果你要根据数据进行确定那些订单是异常订单的话,可能只需要两个中心,一个是正常,一个是异常;所以这个得业务根据不断的探索得到
0

张聪 - 数据挖掘咨询 2016-07-22 回答

k均值聚类中的初始聚类是随机产生,然后通过不断的迭代寻找最优的类中心
0

浩彬老撕 - 数据分析/数据挖掘专家,目前任职于IBM认知计算部门,曾担任SPSS技术工程师,现在负责IBM预测性客户智能方案。 2016-07-24 回答

SPSS的statistics是随机产生初始聚类中心,另外最新版本支持自定义聚类中心;Modeler中则只支持随机产生初始的聚类中心,暂时还不能自定义
0

dj123jary 2016-07-27 回答

楼主是不是想问怎么确定K值啊,确定K值目前也是聚类算法的一个难点,没有通用的方法,都需要根据所选的算法,并结合分析目的来定,对于K-means,目前比较通用的方法有:
1、图示法:比如调和曲线、星型图之类的
2、组内方差拐点法,有时候称为“手肘法”
3、轮廓系统法
 

要回复问题请先登录注册