基础准备
非参数检验是与参数检验相对应的另一套分析方法。当待分析数据是信息含量较低的分类型数据(定类或定序数据),或者是信息含量较高的定距型数据,但分布异常离散聚集性很差(与正态分布有显著性差异)时,可以采用非参数检验的方法来分析这些数据。
非参数检验根据分析原理可以分成两大类:卡方检验和秩和检验;卡方检验的分析原理和作用在前几篇推送中已经详细介绍过,大家可以点击下方链接回顾:
草堂君接下来会再用几篇推送来介绍几种最常用的秩次检验方法。今天介绍的是威尔考克斯(Wilcoxon)符号秩检验。
Wilcoxon符号秩检验
前面介绍过,数据分析者可以通过三个维度对手头数据进行描述(集中趋势、离散程度和分布形态),其中集中趋势指标有均值、中位数和众数等,它们的适用场景是不一样的。如果数据的聚集性很好、离散程度低,那么均值可以代表数据集合的普遍情况;反之,均值不是一个代表数据集合普遍情况的良好指标。例如,在收入两级分化很严重的国家,平均收入是不能代表这个国家大多数人民生活水平的,很多网友在看到统计局发布的人均收入时,会发出自己拉后腿,被平均的感慨。
由于平均值指标的缺陷,对于离散程度较高的数据集合,中位数是更为合理的代表数据集合普遍情况的指标。Wilcoxon符号秩检验就是通过比较不同数据集合中位数是否存在显著性差异,从而推断两个数据集合差异情况的非参数检验方法。中位数也是表现数据集合特性的参数,只不过与均值相比,其测量精度是更低的,为了区别于以均值为比较指标的检验方法,它们都被称为非参数检验,这是一位朋友在后台提出的问题,草堂君在这里做出解答。
Wilcoxon符号秩检验根据样本数的不同,可以分为单样本Wilcoxon检验和两相关样本Wilcoxon检验,在参数检验中,分别对应单样本T检验和两相关样本T检验。单样本Wilcoxon检验,通过对样本数据的分析,得出样本对应总体的中位数是否与一个具体常数存在显著性差异;而两相关样本Wilcoxon检验,检验两个配对数据总体的中位数是否存在显著性差异。下面草堂君用两个具体的案例来介绍Wilcoxon符号秩检验的分析原理。
单样本Wilcoxon检验
职业影评人是一个令人羡慕的工作,不仅能免费看所有电影,还能赚取薪水。影评采取的打分方式一般按照从1(最差)到10(最好)的打分标准进行。某影评网站的一位职业影评人在工作20年后,打算退休,于是公司雇佣另一位职业影评人接替他的工作。工作一个月后,这位新评论员共观看了10部电影,评分是:3.8,5.6,1.8,5.0,2.4,4.2,7.3,8.6,9.1,5.2,公司领导想了解这位新影评人与其前任(评分中位数6.3)在评分尺度上是否存在差异。电影质量不同,打分肯定不同,因此某个影评人的打分数据肯定是离散程度较高的数据集合,如果用均值作为该影评人的打分尺度,肯定是不合适的,所以案例中使用中位数作为影评人的打分尺度指标。
对上述案例的数据做如下处理:
因为|W+|<||,所以检验统计量应该取|W+|=16。查Wilcoxon临界值表,可以知道样本量n=10,显著性α=0.05对应的双侧检验W值等于8,|W+|=16>8,落在接受域,接受原假设,说明新影评人的打分中位数与其前任的6.3没有显著性差异。
两关联样本Wilcoxon检验
单样本Wilcoxon检验对标单样本T检验,两配对样本Wilcoxon检验对标的则是两配对样本T检验。两配对样本Wilcoxon检验的作用是检验两个数据总体的中位数是否存在显著性差异。需要注意的是,这里的两个样本是配对样本,对于两个非配对样本,则不能Wilcoxon检验,这是由Wilcoxon检验原理决定的。两个非配对样本适用的分析方法会在下一篇文章中推送。
牛奶场老板想知道某种新型激素是否会显著增加奶牛的产奶量,为此他特意随机挑选10头奶牛做实验,对于每头奶牛,在没用激素之前记录其产奶量,用激素喂养一周后,再记录其产奶量。10头奶牛的产奶量为:(30,34) (25,35) (22,27) (25,24) (23,25)(34,26) (33,24) (30,24) (24,27) (32,21)。括号中,第一个数据代表使用激素前的产奶量,后一个代表使用激素喂养一周后的产奶量。因为不同奶牛的产奶量差异很大,所以使用均值比较的T检验是不合适的,使用比较中位数的Wilcoxon检验更为合适。
上述案例数据的Wilcoxon检验处理为:
因为|W+|>||,所以检验统计量应该取||=23。查Wilcoxon临界值表,可以知道,样本量n=10,显著性α=0.05对应的单侧检验W值等于11,||=23>11,落在接受域,接受原假设,说明使用激素前后,奶牛的产奶量中位数没有显著性差异。
SPSS案例分析
利用SPSS对上述案例进行计算,看看软件计算结果与手动计算结果是否一致,加深对Wilcoxon检验的理论理解。将上面两个案例的数据整理进SPSS,如下图所示:
(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)
单样本案例分析步骤
1、选择菜单【分析】-【非参数检验】-【单样本】,在跳出的菜单中进行如下操作。点击【目标】菜单,选择定制分析。
2、点击【字段】子菜单,将新影评人打分变量选为检验字段。
3、点击【设置】子菜单,选中比较中位数和假设中位数(威尔科克森符号秩检验),并填写假设的中位数6.3。点击下方【运行】按钮,输出结果。
单样本结果解释
1、单样本威尔科克森符号秩检验汇总结果。从结果可知,检验显著性为0.241,大于0.05,说明新影评人的打分中位数与6.3没有显著性差异。
2、详细检验结果。双击上方检验汇总表格,跳出详细检验步骤结果。下边左图显示假设中位数为6.3,观测到的中位数为5.1;右边表格显示检验统计量等于16,与上方我们手动计算的结果是一致的,进行显著性0.241,大于0.05,说明新影评人的打分中位数与6.3没有显著性差异。
两样本案例分析步骤
1、选择菜单【分析】-【非参数检验】-【相关样本】。点击【目标】子菜单,然后选择定制分析条目。
2、点击【字段】子菜单,将使用激素前产奶量和使用激素后产奶量选入检验字段。
3、点击【设置】子菜单,选择威尔科克森匹配对符号秩检验(2个样本);点击【运行】按钮,输出结果。
结果解释
1、两配对样本威尔科克森符号秩检验汇总结果。从结果可知,检验显著性为0.646,大于0.05,说明使用激素前后的奶牛产奶量没有显著性差异。
2、详细检验结果。双击上方检验汇总表格,跳出详细检验步骤结果。下边左图显示前后两次产奶量的差值及频率;右边表格显示检验统计量等于23,与上方我们手动计算的结果是一致的,进行显著性0.646,大于0.05,说明使用激素前后的奶牛产奶量没有显著性差异。
所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。
温馨提示: