正态性检验方法介绍

浏览: 2845

基础准备

数据分析重要性、数据分析基本策略已经介绍:

大数据时代:数据分析能力重要性

大数据时代:数据分析基础

看完这些内容,你会发现数据分析没有那么高深与神秘。

在数据分析过程中,数据的不同分布形态将直接影响数据分析策略的选择。因此,对数据分布形态的判定是非常重要内容。常见的数据分布形态有正态分布、均匀分布、指数分布、泊松分布等。但最重要也是最有用的分布形态是正态分布,很多数据分析技术都是面向正态分布的定距变量。回顾数据分布内容,请前往统计基础导航页,这里不再链接:

image.png

下面介绍数据正态性的几种判断方法,这些方法其实也适用于其它分布。在Excel中没有数据分布形态判断的功能,但是SPSS中有丰富判断工具。理解判断方法的理论依据是做出正确方法选择的基础,掌握理论再借助SPSS等软件的快速计算展现就能事半功倍。软件教程视频正在录制,敬请期待。

主观判断法

表示频率分布的图形有很多:直方图、曲线图、箱线图和茎叶图等。将待检数据作成这些图形,并与这些图形的正态分布形式对比,可以主观的判断待测数据的分布情况是否为正态分布。这种判断方法的精度不高,但是简单直观快速,对于偏离正态分布很多的数据集,用这种方式就足够了。这里不作过多的操作介绍,分享几幅非正态分布的直方图给大家,大家一眼就能判断它们不是正态分布的吧:

image.png

P-P图和Q-Q图

P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形(P是累积比例单词的首字母)。当数据符合指定分布时,P-P图中各点近似一条直线。以样本的累积频率作为横坐标,以按照正态分布计算的相应累积频率作为纵坐标。举例如下图:

image.png


从上图可以判断数据序列是正态分布的。

Q-Q图与P-P图类似,只不过Q-Q图是以分位数作为横纵坐标。它用标准正态分布的分位数作为横坐标,样本值作为纵坐标。利用Q-Q图鉴别样本数据是否近似于正态分布,只需看图上的点是否在一条直线附近,如下图:

image.png

P-P图和Q-Q图的判断精度比主观判断法的精度更高,但仍然没有量化判断标准,所以还是将它们归类为主观判断的范畴。

卡方拟合优度检验

这部分的内容,在之间介绍过,具体过程请回顾:

正态分布的卡方检验

它的原理就是将实际频率与期望频率差值的平方和期望频率的平方作为卡方统计量的分子和分母,算出得卡方值与卡方临界值对比,判断数据序列是否为卡方分布。

K-S正态性检验

Kolmogorov-Smirnov正态性检验法是检验单一样本是否来自某一特定分布。比如检验一组数据是否为正态分布。它的检验方法是以样本数据的累积频数分布与特定理论分布的累积频率比较,若两者间的差距很小,则推论该样本取自某特定分布族。它的推断过程如下:

image.png

image.png

卡方拟合优度检验与K-S正态检验都采用实际频数与期望频数进行检验。它们之间最大的不同在于前者主要用于类别数据,而后者主要用于有计量单位的连续和定量数据,拟合优度检验虽然也可以用于定量数据,但必须先将数据分组得到实际观测频数,并要求多变量之间独立,而K-S正态检验法可以不分组直接把原始数据的n个观测值进行检验,所以它对数据的利用较完整。


其它方法

上面介绍的这些方法是常用的正态分布检验方法,除此之外,还有利用正态分布百分位及峰度偏度特性进行检验的方法。

W检验和D检验

这两种方法的比较基础是待检数据与正态分布的数据百分位排列情况的对比,区别是W检验的统计量适用于小样本容量(3到50),D检验适用于大样本容量(50到2000)。这里不做深入介绍,后面如果有机会。

峰度与偏度检验

正态分布概率密度曲线的峰度与偏度也有其特点,峰度与偏度检验就是基于正态分布在这两项特性进行数据的比较检验,得出数据分布的结论。这里也不作深入的介绍。    

结论

数据序列正态分布的检验方法很多,但是它们的基础都是利用正态分布的特性(频率分布,曲线形状,百分位排位、峰度偏度等)作为标准,将其与待测数据的这些性质结果进行对比,得出在设定置信水平(常用90%,95%或99%)下的判断结论。

SPSS软件基本包含以上检验方法,此文是理论基础。

教学视频正在录制中,敬请期待!!!

教学视频正在录制中,敬请期待!!!

教学视频正在录制中,敬请期待!!!

紧跟大数据时代,生活统计学栏目


image.png

推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册