SPSS分析技术:均值对应分析;数据分析不应该套用方法,应该建立在理论基础之上融汇贯通

浏览: 3121

基础准备

上篇文章介绍了简单对应分析的原理及应用实例,它能够将交叉表格内复杂不易观察的数据信息呈现在二维的对应分析图上,是一种描述性的统计方法:

今天介绍的均值对应分析就是根据对应分析的原理扩展应用的结果。

均值对应分析

在文章SPSS分析技术:简单对应分析;欧洲人的眼睛和头发颜色有什么搭配规律吗?  中介绍了简单对应分析的第一步就是将交叉列联表中的频数数据进行变换,变换成能够反映两个分类变量不同类别之间关联程度的数据矩阵,也就是从频数数据阵变换成连续数据阵,后续的分析都是基于连续型数据进行的。举个生活案例说明这个转换过程,单元格内的数字代表汽车销售数量:

image.png

通过标准化残差公式,以第一个单元格的数据为例说明转换过程:

image.png

上述标准化残差表的形式其实就是两因素方差分析的连续型数据描述表(单元格内的数据为连续型数据),如下表所示,行和列分别是产品销售区域变量和产品类别变量,中间单元格内的数据为连续型的销售额。

image.png

由此可见,对应分析也能够用于展现两因素方差分析或多因素方差分析中分类变量间的交互作用,例如,通过对应分析图显示产品A在上海地区销售情况较好;这是完全能够实现的,SPSS也为这样应用设计了专门的菜单选项。

均值对应分析的第一步也是数据转换,需要将数据转换成表示行、列分类变量相关关系强度的数据。与简单对应分析不同,由于单元格内的数据不是频数,因此不能使用标准化残差来表示相关强度,而只能使用距离来表示相关强度,这和聚类分析使用距离对个案进行分门别类的原理是一致的。

案例分析

现在有一份城市建设相关的数据,包括两个分类变量:城市变量和建设指标变量。城市变量包括29个省会城市;建设指标变量包括6个类别;用对应分析直观展现29个城市在这六个建设指标上的情况。SPSS数据如下图所示:

image.png

(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)

分析思路

从上图的SPSS数据输入形式可知,这是原始数据汇总表,因此无法直接使用对应分析对话框进行分析。解决方法有两个:第一个方法是将数据转换成频数形式,做加权处理,然后进行分析,可以参考文章:SPSS分析技术:简单对应分析;欧洲人的眼睛和头发颜色有什么搭配规律吗?第二种则是用Syntax变成语言,将数据读入软件,这种方法简单快捷,本案例使用第二种方法。

分析步骤

点击菜单【文件】-【新建】-【语法】,跳出语法对话框,输入下面的语句,然后点击运行按钮,输出结果。

image.png

结果解释

1、维度情况表;从结果可知,前两个维度总共解释了原始数据信息量的91.9%,因此使用前两个维度就能比较好的展示分类变量的交互作用结果。

image.png

2、对应分析图;对应分析图可以按照三个步骤来阅读。

image.png

  • 首先关注城市建设指标散点,六个散点没有被完全分开,其中的四个指标(道路长度、道路面积、下水道长度和路灯数)基本重叠,根据实际情况,这四个指标都是关于道路建设的工程,因此距离接近符合实际情况。

  • 其次二十九个城市的散点也没有分开,其中大部分的城市都聚集在一起,说明它们的城市建设水平很接近;在聚集区域外围,有济南、广州、南京和上海4个散点,说明这4个城市的发展水平和所有城市的平均水平差别较大但特点不同。

  • 最后看交互作用,上海和水处理量比较接近,对照原始数据发现上海市的污水处理量是全国最高的;南京和桥梁长度接近,在原始数据中南京的桥梁长度也是最高的;广州和济南两个城市在道路长度、道路面积、下水道长度和路灯数这四个指标上都处于全国前两名,这样图中的位置相符。

总结一下

需要注意,均值对应分析由于涉及数据转换和标准化方式选择,不同的数据标准化方式,最终作出的对应分析图也有很大的差别,大家应该结合原始数据和对应分析图来对分析结果的优劣做出综合评价。没有分析结果检验是对应分析的缺陷之一。


所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。

温馨提示:

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

  • SPSS教学视频,添加草堂君微信(possitive)索取。

推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册