研究中,变量之间的关系多种多样,我们知道研究两个连续 型变量之间的关系,我们可以用相关分析,研究两个分类变量之间的关系可以用交叉表(卡方检验),而研究分类变量与连续型变量之间的关系我们可以采用T检验,不过结果不是很直观,也不简洁。
今天,我们就介绍一下PS IMAGO PRO里面的一个功能——用于研究两个分类变量之间的关系
•CramersV相关系数功能确认两两类别变量之间的关联程度强弱,并且会根据显着性将结果整理成一张表。SPSS Statistics 的交叉表也可以查看CramersV,但结果为个别呈现,无法快速阅览结果。
例如:
•“Customer_dbase.sav”数据为某电信业者记录内部客户基本资料、家庭、电信设备状况等,以及对于优惠信息回应记录,分析人员想了解第一次回应状况(response_01)与家中是否有网络(internet)、拥有电视(owntv)、拥有电脑(ownpc)、订阅报纸(news)间有无显着关系。
•Step 3. 设置CramersV相关变量功能,选取“response_01”变量至因变量,“Internet、owntv、ownpc、news”变量至“自变量”,如图所示。
•功能说明:
Ø因变量:主要目标变量
Ø自变量:与目标变量比较的变量
•结果会先按照有无显着性来区分,再来依照相关性大小排列,下表可以快速找到显着高相关的变量,并自动绘制结果条形图,按照颜色区分是否为显着变量,以便快速取得结果,如图所示。
我们的结果是不是比SPSS得出的结果更直观明了啊!
实际案例分析——电信客户流失预测
数据如下:我们想研究客户流失与否是否与地区、婚姻、教育水平、性别、套餐类型等分类变量之间的关系,下面就通过CramersV相关系数功能确认两两类别变量之间的关联程度
分析如下:
结果展示: