1 假设检验基本思想

假设检验是由K. Pearson于20世纪提出的,之后由费希尔(Fisher)进行了细化,并最终由奈曼和E. Pearson提出了较完整的假设检验理论。假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设皮尔逊检验R语言 皮尔逊假设检验_假设检验会否正确,首先假定该假设皮尔逊检验R语言 皮尔逊假设检验_假设检验正确,然后根据样本对假设皮尔逊检验R语言 皮尔逊假设检验_假设检验做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”的发生,就应该拒绝假设皮尔逊检验R语言 皮尔逊假设检验_假设检验,否则不拒绝假设皮尔逊检验R语言 皮尔逊假设检验_假设检验

2 假设检验步骤

下面用一个实例引出假设检验中的一些基本概念和操作步骤。

某厂生产的合金强度服从正态分布皮尔逊检验R语言 皮尔逊假设检验_假设检验_06,其中皮尔逊检验R语言 皮尔逊假设检验_算法_07的设计值为不低于皮尔逊检验R语言 皮尔逊假设检验_算法_08帕。为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常执行,即该合金的平均强度不低于皮尔逊检验R语言 皮尔逊假设检验_算法_08帕。从生产的产品中随机抽取皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_10块合金,测得其强度值为皮尔逊检验R语言 皮尔逊假设检验_机器学习_11,均值为皮尔逊检验R语言 皮尔逊假设检验_算法_12帕,问当日生产是否正常?

对这个实际问题可做如下分析:
(1)这不是一个参数估计问题。
(2)这是在给定总体与样本下,要求对命题“合金强度不低于皮尔逊检验R语言 皮尔逊假设检验_机器学习_13帕”作出回答:“是”还是“否”?这类问题称为统计假设检验问题,简称假设检验问题。
(3)命题:“合金平均强度不低于皮尔逊检验R语言 皮尔逊假设检验_机器学习_13帕”仅涉及参数皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_15范围,因此该命题是否正确将涉及如下两个参数集合:皮尔逊检验R语言 皮尔逊假设检验_假设检验_16命题成立对应于“皮尔逊检验R语言 皮尔逊假设检验_概率论_17”,命题不成立则对应“皮尔逊检验R语言 皮尔逊假设检验_假设检验_18”。在统计学中这两个非空不相交参数集合都称作统计假设,简称假设。
(4)假设检验的任务是利用所给总体皮尔逊检验R语言 皮尔逊假设检验_概率论_19和样本均值皮尔逊检验R语言 皮尔逊假设检验_概率论_20帕去判断假设命题“皮尔逊检验R语言 皮尔逊假设检验_概率论_21”是否成立。通过样本对一个假设做出“对”或“不对”的具体判断规则称为该假设的一个检验或检验法则。检验的结果若是肯定该命题,则称接受这个假设,否则就称为拒绝该假设。这里的“接受”或“拒绝”一个假设的行为,只是反映了当事者在给定样本之下对该命题所采取的一种态度,一种行为,而不是从逻辑上或理论上“证明”该命题正确与否。因为所采用的样本是随机的,所以所作的判断也可能是错误的。
(5)若假设可用一个参数的集合表示,该假设检验问题称为参数假设检验问题,否则称为非参数假设检验问题。

2.1 建立假设

对于参数假设检验问题,设有来自某一个参数分布族皮尔逊检验R语言 皮尔逊假设检验_概率论_22的样本皮尔逊检验R语言 皮尔逊假设检验_假设检验_23,其中皮尔逊检验R语言 皮尔逊假设检验_假设检验_24为参数空间,设皮尔逊检验R语言 皮尔逊假设检验_算法_25,且皮尔逊检验R语言 皮尔逊假设检验_概率论_26,则命题皮尔逊检验R语言 皮尔逊假设检验_假设检验_27称为一个假设或原假设或零假设,若有另一个皮尔逊检验R语言 皮尔逊假设检验_假设检验_28皮尔逊检验R语言 皮尔逊假设检验_概率论_29,常见的一种情况是皮尔逊检验R语言 皮尔逊假设检验_假设检验_30),则命题皮尔逊检验R语言 皮尔逊假设检验_概率论_31称为皮尔逊检验R语言 皮尔逊假设检验_假设检验的对立假设或备择假设,即皮尔逊检验R语言 皮尔逊假设检验_假设检验_33皮尔逊检验R语言 皮尔逊假设检验_概率论_34时,则备择假设通常有是三种可能:皮尔逊检验R语言 皮尔逊假设检验_算法_35则称皮尔逊检验R语言 皮尔逊假设检验_机器学习_36为双侧假设或双边假设,皮尔逊检验R语言 皮尔逊假设检验_算法_37以及皮尔逊检验R语言 皮尔逊假设检验_假设检验_38为单侧假设或单边假设。一般情况下,“皮尔逊检验R语言 皮尔逊假设检验_算法_39”需要放在原假设里。对于以上实例,可以建立如下一对假设皮尔逊检验R语言 皮尔逊假设检验_机器学习_40

2.2 检验统计量

当有了具体的样本后,按该法则就可以决定是接受皮尔逊检验R语言 皮尔逊假设检验_假设检验还是拒绝皮尔逊检验R语言 皮尔逊假设检验_假设检验,即检验就等价于把样本空间划分成两个互不相关的部分皮尔逊检验R语言 皮尔逊假设检验_概率论_43皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_44,当样本属于皮尔逊检验R语言 皮尔逊假设检验_概率论_43时,拒绝皮尔逊检验R语言 皮尔逊假设检验_假设检验;否则接受皮尔逊检验R语言 皮尔逊假设检验_假设检验。于是则称皮尔逊检验R语言 皮尔逊假设检验_概率论_43为该检验的拒绝域,而皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_44称为接受域。由样本对原假设进行检验总是通过一个统计量完成的,该统计量称为检验统计量。在以上实例中,样本均值皮尔逊检验R语言 皮尔逊假设检验_机器学习_50就是一个检验统计量,因为要检验的假设是正态总体均值,在方差已知的场合,样本均值皮尔逊检验R语言 皮尔逊假设检验_机器学习_50是总体均值的充分统计量。当样本均值皮尔逊检验R语言 皮尔逊假设检验_机器学习_50越大时,意味着总体均值皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_15也越大;样本均值皮尔逊检验R语言 皮尔逊假设检验_机器学习_50越小时,意味着总体均值皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_15也越小,所以拒绝域的形式如下所示:皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_56其中皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_57是临界值。

2.3 选择显著性水平

由于样本是随机的,故当应用某种检验做判断时,可能做出正确的判断,也可能做出错误判断。因此,可能犯如下两种错误:当皮尔逊检验R语言 皮尔逊假设检验_概率论_17时,样本由于随机性却落入了拒绝域皮尔逊检验R语言 皮尔逊假设检验_概率论_43,于是采取了拒绝皮尔逊检验R语言 皮尔逊假设检验_假设检验的错误决策,此时称这样的错误为第一类错误,计算公式为皮尔逊检验R语言 皮尔逊假设检验_概率论_61皮尔逊检验R语言 皮尔逊假设检验_假设检验_18时,样本却落入接受域皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_44,于是采取了接受皮尔逊检验R语言 皮尔逊假设检验_假设检验的错误决策,此时称这样的错误为第二类错误,计算公式为皮尔逊检验R语言 皮尔逊假设检验_假设检验_65在样本量给定的条件下,皮尔逊检验R语言 皮尔逊假设检验_机器学习_66皮尔逊检验R语言 皮尔逊假设检验_假设检验_67中一个减小必导致另一个增大,所以不可能找到一个使皮尔逊检验R语言 皮尔逊假设检验_机器学习_66皮尔逊检验R语言 皮尔逊假设检验_假设检验_67都小的检验。另外,犯第二类错误的概率在很多情况下不易求出。由于不能同时控制一个检验的犯第一类,第二类错误的概率,在此背景下,会采取折中的方案,通常的作法是仅限制犯第一类错误的概率,这就是费希尔的显著性检验,显著性水平皮尔逊检验R语言 皮尔逊假设检验_机器学习_66就是用来控制犯第一类错误的概率。

2.4 给出拒绝域

在确定显著性水平后,可以给出检验的拒绝域皮尔逊检验R语言 皮尔逊假设检验_概率论_43。在以上实例中,对给定的显著性水平皮尔逊检验R语言 皮尔逊假设检验_机器学习_66,则要求对于任意的皮尔逊检验R语言 皮尔逊假设检验_假设检验_73,则有皮尔逊检验R语言 皮尔逊假设检验_假设检验_74其中皮尔逊检验R语言 皮尔逊假设检验_概率论_75于是皮尔逊检验R语言 皮尔逊假设检验_机器学习_76是关于皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_15的单调递减函数,因此只需要求以下等式皮尔逊检验R语言 皮尔逊假设检验_概率论_78用标准正态分布分位数可把上式写成皮尔逊检验R语言 皮尔逊假设检验_机器学习_79,从而皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_57值为皮尔逊检验R语言 皮尔逊假设检验_概率论_81,检验的拒绝域为皮尔逊检验R语言 皮尔逊假设检验_算法_82若取皮尔逊检验R语言 皮尔逊假设检验_假设检验_83,则皮尔逊检验R语言 皮尔逊假设检验_机器学习_84,具体皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_57值为皮尔逊检验R语言 皮尔逊假设检验_机器学习_86所以,检验的拒绝域为皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_87若令皮尔逊检验R语言 皮尔逊假设检验_算法_88,则拒绝域另一种表示为皮尔逊检验R语言 皮尔逊假设检验_机器学习_89

2.5 做出判断

在有了明确的拒绝域皮尔逊检验R语言 皮尔逊假设检验_概率论_43后,根据样本观测值可以做出判断:

  • 皮尔逊检验R语言 皮尔逊假设检验_算法_91时,则拒绝皮尔逊检验R语言 皮尔逊假设检验_概率论_92,即接受皮尔逊检验R语言 皮尔逊假设检验_算法_93
  • 皮尔逊检验R语言 皮尔逊假设检验_机器学习_94时,则接受皮尔逊检验R语言 皮尔逊假设检验_概率论_92
    在以上实例中,由于皮尔逊检验R语言 皮尔逊假设检验_机器学习_96因此拒绝原假设,即认为该日常生产不正常。

·

3 利用p值进行决策

如果原假设是正确的话,得到目前这个样本数据的可能性皮尔逊检验R语言 皮尔逊假设检验_算法_97有多大,如果这个可能性皮尔逊检验R语言 皮尔逊假设检验_算法_97小于显著性水平皮尔逊检验R语言 皮尔逊假设检验_机器学习_66就应该拒绝原假设,即若皮尔逊检验R语言 皮尔逊假设检验_概率论_100,拒绝皮尔逊检验R语言 皮尔逊假设检验_假设检验

3.1 p值检验实例

在掷骰子的试验中,掷了皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_102次骰子只出现了皮尔逊检验R语言 皮尔逊假设检验_算法_103皮尔逊检验R语言 皮尔逊假设检验_假设检验_104点。这个现象能够说明,在皮尔逊检验R语言 皮尔逊假设检验_机器学习_105的显著性水平下,出现皮尔逊检验R语言 皮尔逊假设检验_假设检验_104点的概率小于皮尔逊检验R语言 皮尔逊假设检验_算法_107吗?

给出一对原假设皮尔逊检验R语言 皮尔逊假设检验_假设检验和备择假设皮尔逊检验R语言 皮尔逊假设检验_算法_109如下所示:皮尔逊检验R语言 皮尔逊假设检验_假设检验_110皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_111表示骰子为皮尔逊检验R语言 皮尔逊假设检验_机器学习_112点的次数,此时皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_111服从二项分布皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_114,进而可知当出现皮尔逊检验R语言 皮尔逊假设检验_机器学习_112点的概率小于皮尔逊检验R语言 皮尔逊假设检验_概率论_116时,可推导出皮尔逊检验R语言 皮尔逊假设检验_皮尔逊检验R语言_117所以接受原假设, 即出现皮尔逊检验R语言 皮尔逊假设检验_机器学习_112点的概率为皮尔逊检验R语言 皮尔逊假设检验_概率论_116