目录
方差分析概述
方差分析
单因素方差分析原理
单因素方差分析的应用
深入单因素方差分析
单因素方差分析深入应用
方差分析概述
引例
对影响农作物产量的各种因素进行定量的对比研究,并在此基础上制定最佳的种植组合方案。影响农作物产量的因素有品种、施肥量、地域特征等。找到众多影响因素中重要的和关键的影响因素非常重要;进一步,在掌握了关键因素,如品种、施肥量等以后,还 需要对不同的品种、不同的施肥量等进行对比分析,研究究竟哪个品种的产量高,施肥量究竟多少最合适,哪个品种与哪种施肥水平搭配最优等。
上述问题的研究就可以通过方差分析实现。在方差分析中,上述问题中的农作物产量称为观测因素(观测变量);品种、施肥量等影响因素称为控制因素(控制变量);将控制变量的不同类别(如 甲品种、乙品种、丙品种;10千克化肥、20千克化肥、30千克化 肥)称为控制变量的不同水平。
方差分析
方差分析的基本假设前提
- 观测变量各总体应服从正态分布
- 观测变量各总体的方差应相同
基于上述两个基本假设,方差分析对各总体分布是否有显著差异的推断就转化成对各总体均值是否存在显著差异的推断。
方差分析研究的问题
方差分析(Analysis of Variance,ANOVA)是假设检验的一种延续与扩展,主要用来对多个总体均值(三组或三组以上均值)是否相等作出假设检验。
从观测变量的方差分解入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量,对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的。 它的零假设(原假设)和备择假设分别为:
观测变量值的两类影响因素
观测变量值的变化受两类因素的影响
- 控制因素(控制变量)不同水平所产生的影响
- 随机因素(随机变量)所产生的影响
若观测变量值在某控制变量的各个水平中出现了明显波动,则认为该控制变量是影响观测变量的主要因素;若观测变量值在某控制变量的各个水平中没有出现明显波动,则认为该控制变量没有对观测变量产生重要影响,观测变量的数据波动是由抽样误差造成的。
单因素方差分析原理
单因素方差分析的基本思想
单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
单因素方差分析的步骤
第一步:提出假设
第二步:分别计算各组的平均成绩与总平均成绩
第三步:成绩的总变化(观测变量总离差平方和)
第四步:控制变量引起的变化(组间离差平方和)
第五步:随机变量引起的变化(组内离差平方和)
第六步:计算MSA、MSE
第七步:计算比值
第八步:给定显著性水平α,并作出决策
给定显著性水平α,与检验统计量的概率P值作比较。若概率P 值小于等于α,拒绝原假设;否则,不能拒绝原假设。
单因素方差分析的应用
在利用SPSS进行单因素方差分析时,应注意数据的组织形式。 SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。
【案例】 某企业在制定某商品的广告策略时,收集了该商品在不同地区 采用不同广告形式促销后的销售额数据,希望对广告形式和地区是 否对商品销售额产生影响进行分析。
分析:
两个单因素方差分析的原假设H0分别为:不同广告形式没有对销售额的平均值产生显著影响(即不同广告形式对销售额的效应同 时为0);不同地区的销售额的平均值没有显著差异(即不同地区对 销售额的效应同时为0)
操作步骤:
①选择菜单【分析】----> 【比较平均值】----> 【单因素ANOVA检 验】
②选择观测变量到【因变量列表(E)】框中,选择控制变量到【因子 (F)】框中
③点击“确定”,得到广告形式对销售额影响的单因素方差分析结果
④同理,可以得到地区对销售额影响的单因素方差分析结果
结论:从上面两个表中可知:概率P值都近似为0,小于显著性 水平α,拒绝原假设,即:不同广告形式对销售额的平均值产生了显著影响;不同地区也对销售额的平均值产生了显著影响。如果从单 因素的角度考虑,广告形式对销售额的影响比地区大。
注意: 在方差分析中,最标准的做法是先进行方差齐性检验。
深入单因素方差分析
方差齐性检验
- 方差齐性检验是对控制变量不同水平下各观测变量总体方差是否相等进行分析
- 方差齐性是方差分析的前提要求
- SPSS单因素方差分析中,方差齐性检验采用了方差同质性检验方法,其原假设H0是:各水平下观测变量总体方差无显著差异
多重比较检验
对于方差分析的结论,如果拒绝了原假设H0,则有必要进一步分析,到底是哪两组均值不相等,这就是多重比较检验。
- 多重比较检验利用了全部观测变量值,实现对各个水平下观测变 量总体均值的逐对比较
- 多重比较检验的原假设H0是:第i和第j个水平下观测变量的总体 均值μi和μj不存在显著差异
- SPSS提供了诸多多重比较检验方法,其差异主要体现在检验统 计量的构造上
- LSD(Least Significant Difference)方法,最小显著性差异。检验敏感性高,即水平间的均值只要存在一定程度的微小差异就可能被检验出来
- Bonferroni方法
- Tukey方法
- Scheffe方法
- S-N-K方法:适用于各水平观测值个数相等的情况
单因素方差分析深入应用
方差齐性检验:不同广告形式销售额总体的方差是否相同,是否满足单因素方差分析的前提要求 。
操作步骤:
①选择菜单【分析】----> 【比较平均值】----> 【单因素ANOVA检 验】
②点击【选项(O)】按钮,对话框中的【方差齐性检验(H)】选项表示进行方差齐性检验,还可以选择输出观测变量的基本描述统计 量;【平均值图(M)】选项表示绘制各水平下观测变量均值的折线图
③方差齐性检验结果为:
- 如果符合正态性,那就看第一行——基于均值的Levene统计量;
- 如果你的数据在检验正态性之后,是偏态的,就看第二行——基于中值那一行;
- 如果数据有明显的极端值,看第四行;
- 第三行通常用不到
方差齐性检验结论:
从表中可以看到:不同广告形式下销售额的方差齐性检验的检验统计量的观测值为0.765,概率P值为0.515,如果显著性水平α为 0.05,由于概率P值大于显著性水平,因此不应该拒绝原假设,认为不同广告形式下销售额的总体方差无显著差异,满足方差分析的前提要求。
多重比较检验
从总体上讲,不同广告形式对产品的销售额有显著影响,那么究竟哪种广告形式的作用较明显,哪种不明显,这个问题可通过多重比较检验解决。
操作步骤:
①选择菜单【分析】----> 【比较平均值】----> 【单因素ANOVA检验】
②点击【事后比较(H)】按钮,并选择
③部分结果如下
多重比较检验结论:
表中分别显示了两两广告形式下销售额均值检验的结果,可以发现各种方法在检验敏感度上的差异。比如:以检验敏感度最高的 LSD方法为例,报纸广告和广播广告的效果没有显著差异(概率P值 为0.412),与宣传品广告和体验广告均有显著差异(概率P值分别 为0.000(接近0)和0.021)。