背景介绍
常用统计方法分为描述统计和推断统计,前者能够应用在所有数据集合,包括样本和总体,而后者则是从样本出发推断总体性质。用样本的均值来估计总体的均值,必须进行样本均值的T检验。
要对总体特征进行推断比较,样本是必不可少的。根据是否采用随机抽样,将样本分为随机样本和非随机样本,统计学基本都以随机样本为研究对象。通常在以下两种情况可以利用样本数据对总体特征进行推断。
总体分布为已知(如总体为正态分布),根据样本数据对总体的参数(均值、方差等)进行推断。这类推断常用参数的区间估计和假设检验的方法来实现。
总体分布未知,根据样本数据对总体分布的形式或特征进行推断。此时常采用非参数检验来完成对总体分布情况的推断。
均值比较
均值的假设检验包括三种类型:
单样本T检验,这是用样本的均值与某个常数进行比较,该常数是假设的总体均值;
独立样本T检验,这是用两个样本的均值之差的大小来检验对应的两个总体的均值是否相等的方法;
配对样本T检验,这是用配对样本的两次测量结果差异的大小来检验两个总体的差异是否显著的方法。
假设检验
假设检验是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立,并对假设给予接受或拒绝的过程。统计学上的两种假设为原假设和备择假设。
原假设就是假设变量之间没有差异或不相关,备择假设是与原假设相反的假设,在统计学中,我们无法对备择假设进行直接检验,只能对原假设进行直接检验。根据是否强调检验方向性,假设检验可分为单尾假设检验和双尾假设检验。单尾检验强关心研究对象高于还是低于某一水平,而双尾检验值关心两个总体参数之间是否有差异。
假设检验步骤
提出假设;根据研究目的提出相应的原假设和备择假设,根据实际情况选择单尾检验方式还是双尾检验方式。
选择检验统计量;根据原假设提供的前提条件,选择合适的检验统计量。
计算概率值;根据统计量分布,计算样本观测值对应的统计量观测值发生的概率值,又称为P值或观测到的显著性水平。
作出判断;将给定的显著性水平与计算p值比较,作出判断。若p值小于显著性水平,则拒绝原假设,即总体均值与检验值之间有显著性差异;反之,则不能拒绝原假设,即总体均值与检验值之间无显著性差异。