单因素方差分析 (one-way ANOVA): 在一项试验中,仅涉及一个处理因素,也就是只有一个因素的水平(多水平)在改变,其他因子(两个或多个)的水平取定,这样的试验称为单因素试验;相应的方差分析称为单因素方差分析或一元方差分析。
这个理解稍微有点晦涩,举个栗子吧!一个养猪场为了比较5种(A1 A2 A3 A4 A5)饲料对猪的增肥程度。其他因素(比如,温度,场地,作息时间等)已经确定(都相同)。此时就可以用到单因素方差分析(因素为饲料,饲料因素下面有4个水平,其他因素已经确定)。
在上例中,因素A(即饲料)有s(=5)个水平
,在每一个水平下进行了nj = 4次(每组内有4个变量)独立试验,这些结果是一个随机变量。这20个变量可以看成来自s(=5)个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为,则按题意需检验假设:
不全相等。
为了便于讨论,现在引入总平均μ。
再引入水平Aj的效应δj
,
显然有,
δj表示水平Aj下的总体平均值与总平均的差异。我们利用这些记号,本例的假设就等价于假设:
不全为零。
因此,单因素方差分析的任务就是检验s个总体的均值μj 是否相等,也就等价于检验各水平Aj 的效应δj 是否都等于零。
假设各总体服从正态分布,且方差相同,即假定各个水平下的样本来自正态总体
N(μj ,σ2),μj 与σ2 未知,且设不同水平Aj下的样本之间相互独立,则单因素方差分析所需的检验统计量可以从总平方和的分解导出来。下面先引入:
水平Aj下的样本平均值:
数据的总平均:
总平方和:
总平方和ST反映了全部试验数据之间的差异,因此ST又称为总变差。
将其分解为:ST = SE + SA
其中:
上述SE的各项表示了在水平Aj下,样本观察值与样本均值的差异,这是由随机误差所引起的,因此SE叫做误差平方和;SA的各项表示了在水平Aj下的样本平均值与数据总平均的差异,这是由水平Aj以及随机误差所引起的。因此SA叫做因素A的效应平方和。
可以证明SA与SE相互独立,
且当为真时,SA与SE分别服从自由度为(s-1,n-s)的卡方分布,于是,当为真时,
这就是单因素方差分析所需的服从F分布的检验统计量。
通过上面的分析可得,在显著性水平α下,本检验问题的拒绝域为
理论操作步骤不再赘述(参见前几期),软件SPSS操作步骤,有机会详细说明。