你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

BI 社区商业智能社区

结实

始终在寻找数据的落脚点与发光点。还好，让我赶上了这个大数据时代，感恩中前行~！在工作中学习，在学习中分享，在分享中传递，在传递中提升。come on。我是结实，我来了。

均值比较的检验（二）

发表: 2016-07-29 浏览: 1533

统计学

单因素方差分析（one-way ANOVA）: 在一项试验中，仅涉及一个处理因素，也就是只有一个因素的水平（多水平）在改变，其他因子（两个或多个）的水平取定，这样的试验称为单因素试验；相应的方差分析称为单因素方差分析或一元方差分析。

这个理解稍微有点晦涩，举个栗子吧！一个养猪场为了比较5种(A1 A2 A3 A4 A5)饲料对猪的增肥程度。其他因素（比如，温度，场地，作息时间等）已经确定（都相同）。此时就可以用到单因素方差分析（因素为饲料，饲料因素下面有4个水平，其他因素已经确定）。

在上例中，因素A（即饲料）有s（=5）个水平
，在每一个水平下进行了nj = 4次（每组内有4个变量）独立试验，这些结果是一个随机变量。这20个变量可以看成来自s（=5）个不同总体（每个水平对应一个总体）的样本值，将各个总体的均值依次记为,则按题意需检验假设：

不全相等。

为了便于讨论，现在引入总平均μ。

再引入水平Aj的效应δj

，

显然有，

δj表示水平Aj下的总体平均值与总平均的差异。我们利用这些记号，本例的假设就等价于假设：

不全为零。

因此，单因素方差分析的任务就是检验s个总体的均值μj 是否相等，也就等价于检验各水平Aj 的效应δj 是否都等于零。

假设各总体服从正态分布，且方差相同，即假定各个水平下的样本来自正态总体

N(μj ,σ2)，μj 与σ2 未知，且设不同水平Aj下的样本之间相互独立，则单因素方差分析所需的检验统计量可以从总平方和的分解导出来。下面先引入：

水平Aj下的样本平均值:

　数据的总平均:

　总平方和:

总平方和ST反映了全部试验数据之间的差异，因此ST又称为总变差。

将其分解为：ST = SE + SA

其中:

上述SE的各项表示了在水平Aj下，样本观察值与样本均值的差异，这是由随机误差所引起的，因此SE叫做误差平方和；SA的各项表示了在水平Aj下的样本平均值与数据总平均的差异，这是由水平Aj以及随机误差所引起的。因此SA叫做因素A的效应平方和。

可以证明SA与SE相互独立，

且当为真时，SA与SE分别服从自由度为（s-1,n-s）的卡方分布，于是，当为真时，

这就是单因素方差分析所需的服从F分布的检验统计量。

通过上面的分析可得，在显著性水平α下，本检验问题的拒绝域为

理论操作步骤不再赘述（参见前几期），软件SPSS操作步骤，有机会详细说明。

推荐 3

本文由结实创作，采用知识共享署名-相同方式共享 3.0 中国大陆许可协议进行许可。
转载、引用前需联系作者，并署名作者且注明文章出处。

本站文章版权归原作者及原出处所有。内容为作者个人观点，并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台，并不用于任何商业目的，如果有任何问题，请及时联系我们，我们将根据著作权人的要求，立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录或注册