单因素方差分析是指对单因素试验结果进行分析,检验因素对试验结果有无显著性影响的方法。

单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而确定因素对试验结果有无显著性影响的一种统计方法

 

  • 因素:影响研究对象的某一指标变量
  • 水平:因素变化的各种状态或因素变化所分的等级或组别。
  • 单因素试验:考虑的因素只有一个的试验叫单因素试验。

 

例如,将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。下表列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。现需要在显著性水平α = 0.05下检验这些百分比的均值有无显著的差异。设各总体服从正态分布,且方差相同。

青霉素 四环素 链霉素 红霉素 氯霉素
29.6 27.3 5.8 21.6 29.2
24.3 32.6 6.2 17.4 32.8
28.5 30.8 11.0 18.3 25.0
32.0 34.8 8.3 19.0 24.2

  在这里,试验的指标是抗生素与血浆蛋白质结合的百分比,抗生素为因素,不同的5种抗生素就是这个因素的五个不同的水平。假定除抗生素这一因素外,其余的一切条件都相同。这就是单因素试验。试验的目的是要考察这些抗生素与血浆蛋白质结合的百分比的均值有无显著的差异。即考察抗生素这一因素对这些百分比有无显著影响。这就是一个典型的单因素试验的方差分析问题

 

  与通常的统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。

  在上例中,因素A(即抗生素)有s(=5)个水平单因素方差分析(One Way ANOVA)_数据算法,在每一个水平单因素方差分析(One Way ANOVA)_数据算法_02下进行了nj = 4次独立试验,得到如上表所示的结果。这些结果是一个随机变量。表中的数据可以看成来自s个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为单因素方差分析(One Way ANOVA)_数据算法_03,则按题意需检验假设

  单因素方差分析(One Way ANOVA)_数据算法_04

  单因素方差分析(One Way ANOVA)_数据算法_05不全相等

为了便于讨论,现在引入总平均μ

  单因素方差分析(One Way ANOVA)_数据算法_06 其中:单因素方差分析(One Way ANOVA)_数据算法_07

再引入水平Aj的效应δj

单因素方差分析(One Way ANOVA)_数据算法_08

显然有单因素方差分析(One Way ANOVA)_数据算法_09,δj表示水平Aj下的总体平均值与总平均的差异。

利用这些记号,本例的假设就等价于假设

  单因素方差分析(One Way ANOVA)_数据算法_10

  单因素方差分析(One Way ANOVA)_数据算法_11不全为零

因此,单因素方差分析的任务就是检验s个总体的均值μj是否相等,也就等价于检验各水平Aj的效应δj是否都等于零。

  2. 检验所需的统计量

  假设各总体服从正态分布,且方差相同,即假定各个水平单因素方差分析(One Way ANOVA)_数据算法_02下的样本单因素方差分析(One Way ANOVA)_数据算法_13来自正态总体N(μj,σ2),μj与σ2未知,且设不同水平Aj下的样本之间相互独立,则单因素方差分析所需的检验统计量可以从总平方和的分解导出来。下面先引入:

  水平Aj下的样本平均值:

  单因素方差分析(One Way ANOVA)_数据算法_14

  数据的总平均:

  单因素方差分析(One Way ANOVA)_数据算法_15

  总平方和:

  单因素方差分析(One Way ANOVA)_数据算法_16

总平方和ST反映了全部试验数据之间的差异,因此ST又称为总变差。将其分解为

  ST = SE + SA

其中:

  单因素方差分析(One Way ANOVA)_数据算法_17

  单因素方差分析(One Way ANOVA)_数据算法_18

上述SE的各项单因素方差分析(One Way ANOVA)_数据算法_19表示了在水平Aj下,样本观察值与样本均值的差异,这是由随机误差所引起的,因此SE叫做误差平方和。SA的各项单因素方差分析(One Way ANOVA)_数据算法_20表示了在水平Aj下的样本平均值与数据总平均的差异,这是由水平Aj以及随机误差所引起的,因此SA叫做因素A的效应平方和。

  可以证明SA与SE相互独立,且当单因素方差分析(One Way ANOVA)_数据算法_10为真时,SA与SE分别服从自由度为s − 1,n − s的χ2分布,即

  SA / σ2˜χ2(s − 1)

  SE / σ2˜χ2(n − s)

于是,当单因素方差分析(One Way ANOVA)_数据算法_10为真时

  单因素方差分析(One Way ANOVA)_数据算法_23

这就是单因素方差分析所需的服从F分布的检验统计量。

  3. 假设检验的拒绝域

  通过上面的分析可得,在显著性水平α下,本检验问题的拒绝域为

  单因素方差分析(One Way ANOVA)_数据算法_24

为了方便分析比较,通常将上述分析结果编排成如下表所示的方差分析表。表中的单因素方差分析(One Way ANOVA)_数据算法_25分别称为SA,SE的均方。

方差来源 平方和 自由度 均方 F比
因素A SA s − 1 单因素方差分析(One Way ANOVA)_数据算法_26 单因素方差分析(One Way ANOVA)_数据算法_27
误差 SE n − s 单因素方差分析(One Way ANOVA)_数据算法_28  
总和 ST n − 1