数据分布形状描述

浏览: 2522

基础准备

数据可以从三个方面进行统计描述:


数据分布形状描述的两个主要指标是:峰度和偏度。数据的集中趋势与离散程度不同,峰度和偏度也是不同的。

峰度(Kurtosis)

峰度是描述总体(样本)中所有取值分布形态陡缓程度的统计量。通过计算可以得到峰度系数,峰度系数与分布形态的关系是:

峰度系数=3,扁平程度适中;

峰度系数<3,为扁平分布;

峰度系数>3,为尖峰分布;

正态分布的峰度系数为3。用SPSS计算峰度系数时,显示的结果是减去3后得到的数字,也就是与正态分布对比。所以SPSS的峰度系数与分布形态的关系是:

峰度系数=0,数据分布与正态分布的陡缓程度相同;

峰度系数<0,数据分布与正态分布相比较为平坦,为平顶峰;

峰度系数>0,数据分布与正态分布相比较为陡峭,为尖顶峰;


峰度系数


偏度(Skewness)

偏度这一指标,又称偏斜系数、偏态系数,是用来帮助判断数据序列的分布规律性的指标。 在数据序列呈对称分布(正态分布)的状态下,其均值、中位数和众数重合。且在这三个数的两侧,其它所有的数据完全以对称的方式左右分布。如果数据序列的分布不对称,则均值、中位数和众数必定分处不同的位置。这时,若以均值为参照点,则要么位于均值左侧的数据较多,称之为右偏;要么位于均值右侧的数据较多,称之为左偏(左偏还是右偏是以长尾为标志)。考虑到所有数据与均值之间的离差之和应为零这一约束,则当均值左侧数据较多的时候,均值的右侧必定存在数值较大的“离群”数据;同理,当均值右侧数据较多的时候,均值的左侧必定存在数值较小的“离群”数据。

峰度系数与分布形态的关系是:

偏度系数=0,为对称分布;

偏度系数<0,为左偏分布,长尾巴拖在左边;

偏度系数>0,为右偏分布,长尾巴拖在右边;


偏度系数


范例分析

国家统计局在某年对农村家庭纯收入数据进行统计,结果如下:


通过计算峰度和偏度系数,说明该年我国农村居民家庭纯收入的分布情况。



结论:

峰度系数为3.33>3,说明我国农村居民家庭纯收入为尖峰分布;同时,偏度系数0.956>0,说明数据为正偏(右偏),长尾拖在右边;综合两个系数,可以知道农村居民家庭纯收入中低收入占有较大比重。

推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册