分类变量与分类变量之间的相关性——PS IMAGO PRO轻松实现

浏览: 3156

  研究中,变量之间的关系多种多样,我们知道研究两个连续 型变量之间的关系,我们可以用相关分析,研究两个分类变量之间的关系可以用交叉表(卡方检验),而研究分类变量与连续型变量之间的关系我们可以采用T检验,不过结果不是很直观,也不简洁。

今天,我们就介绍一下PS IMAGO PRO里面的一个功能——用于研究两个分类变量之间的关系

CramersV相关系数功能确认两两类别变量之间的关联程度强弱,并且会根据显着性将结果整理成一张表。SPSS  Statistics 的交叉表也可以查看CramersV,但结果为个别呈现,无法快速阅览结果

例如:

Customer_dbase.sav数据为某电信业者记录内部客户基本资料、家庭、电信设备状况等,以及对于优惠信息回应记录,分析人员想了解第一次回应状况(response_01)与家中是否有网络(internet)、拥有电视(owntv)、拥有电脑(ownpc)、订阅报纸(news)间有无显着关系。

image.png

image.png

Step 3. 设置CramersV相关变量功能,选取“response_01”变量至因变量,“Internetowntvownpcnews”变量至“自变量”,如图所示。

image.png

功能说明:

Ø因变量:主要目标变量

Ø自变量:与目标变量比较的变量

结果会先按照有无显着性来区分,再来依照相关性大小排列,下表可以快速找到显着高相关的变量,并自动绘制结果条形图,按照颜色区分是否为显着变量,以便快速取得结果,如图所示。

image.png    image.png


我们的结果是不是比SPSS得出的结果更直观明了啊!

实际案例分析——电信客户流失预测

数据如下:我们想研究客户流失与否是否与地区、婚姻、教育水平、性别、套餐类型等分类变量之间的关系,下面就通过CramersV相关系数功能确认两两类别变量之间的关联程度

image.png


分析如下:

image.png


结果展示:

image.png  image.png

推荐 0
本文由 DDlucky 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册