假设检验理论的创立者 Fisher 在假设检验中首先提出了 P 值的概念。他认为假设检验是一种程序,人们依照这一程序可以对某一总体参数形成一种判断。换句话说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。

P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率

如果原假设为真,P 值是抽样分布中大于或小于样本统计量的概率。当左侧检验时,P 值为曲线上方小于检验统计量部分的面积;当右侧检验时,P 值为曲线上方大于检验统计量部分的面积。P 值被称为观察到的( 或实测的) 显著性水平。

通过 P 值,可以知道在 P < α 的情况下犯第一类错误的实际概率是多少。如果 P > α,那么原假设不被拒绝,在这种情况下,第一类错误并不会发生。P 值也可以说是拒绝原假设的最小显著性水平,或观察到的( 实例的) 显著性水平,或显著性概率。P 值表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

举个例子:
就从打赌开始说起。
一日闲机无聊,我与楼主会饮于望胡楼。饮罢,两人都不想主动买单,于是我提议以置硬币来决定谁买单。
规则是这样的:有二十个一元硬币,谁的菊花朝上多,谁就算赢。
然后楼主先投,有十一个硬币菊花朝上。
他就得意洋洋的看我。
然后我一扔,有十九个硬币个个菊花朝天。

楼主角色由红转白,由白转黑。
拍案而起,大吼一声,你丫作弊,硬币有问题!
我笑而不语问楼主:凭什么说硬币有问题?

难道二十个硬币中十九个硬币菊花朝上就根本不可能么?显然理论上是可能的,但是楼主依旧会认为我在作弊,实际上,任何人见到这个的场景都会怀疑背后有猫腻。

因为楼主或其他任何人都知道:假如这场打赌是公平的话,那么每一个硬币的两面都有相等的概率向上,所以每个硬币菊花朝上的概率都是1/2也就是0.5,那么十九个菊花朝上的概率是20/1048576,约等于0.00002。

这种概率太小了,楼主认为在假如我没有在硬币上做手脚以让结果有利于我的话是不可能发生这种情况的。

我立刻反驳说,你这是嫉妒我,那我要扔出二十个菊花朝上你还不是要说我也在作弊?

楼主说,没错,我既然认为你扔出十九个菊花朝上是在作弊,那二十个菊花朝上当然也是因为你对硬币动了手脚!

让我们用统计学的语言概括一下。

H0:我没有对硬币动手脚。
H1:我对硬币动了手脚,以让结果偏向于我。

(这里面的H0称之为检验假设,意思是说你要检验的这个假设,H1称之为备择假设。他们两的关系是不能兼容的。这两者只能且必须拒绝一个。假如拒绝H0的话,那么就不能拒绝H1了。)

于是我们做了一个实验(赌博)。

结果出现了十九个硬币菊花朝上的情况。假如赌博是公平的,那么出现这种情况的概率是20/1048576。而比这种情况更加极端的二十个硬币统统朝上的概率是1/1048576,这种概率更加低。

假如我们认为十九个硬币朝上是个小概率事件的话,那么比它更极端的二十个硬币朝上是一个更加极端的更小概率事件。

这两者的和是21/1048576。

于是楼主认为在这么一次实验(赌博)当中出现这么个小概率事件或者比它更极端的事件是不肯能的。

于是只能拒绝H0,于是不能拒绝H1。

也就是说我对硬币动了手脚,以让结果偏向于我。

以上就是假设检验的基本思想,里面涉及到了楼主的一个问题,什么是p值?

这里的p值等于21/1048576,p值就是假如赌博是公平的,那么出现这种情况和比这种情况更极端的概率值。

翻译成干巴巴的语言就是在H0成立的条件下,出现该实验结果或更极端情况的概率值。

显著性水平:拒绝零假设时候P值阈值。

虽然 p值不等价于原假设成立的概率,但可以看成判断原假设命题成立与否的一个客观指标。我们建议把 p 值翻译成“庇值”,意思是对原假设的庇护或者保护之意,读音也没有太大改变。另一个原因是因为在很多假设检验问题中的原假设往往是一个不会被轻易否定的命题,也有庇护和保护之意。所以“庇值”也能反映这层意思。

假设检验
假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
显著性检验
显著性检验是假设检验中最常用的一种方法,其基本原理是先对总体的特征做出某种假设,然后通过抽样样本的分析,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有t检验、卡方检验、F检验等。
检验的原理
基本思想是小概率事件,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,一般认为概率P在0.05以内就算小概率事件,所以通常算出来的P值都和0.05比较。
检验的步骤
1、提出原假设和备择假设。
原假设:是数理统计的专用术语,也叫无效假设,认为样本之间没有差异(或者说样本之间的差异是抽样误差引起的),原假设就必须认为没差异,没有为啥。
备择假设:就是原假设的对立面,认为样本之间有本质的差异。
说明:到底什么叫本质的差异?或者说到底什么叫没有差异?是样本一模一样吗?当然不是,也不可能。几个例子,高三1班和高三2班每个班50个人,组织了一场数学考试,那么每个班数学考试都会有50个人的成绩,那作为数学老师怎么判断这两个班的学生有没有差异呢(有差异的意思就是1班的能力就是比2班强,反之也可,都叫有本质的差异)?最简单的办法是判断平均值,但是太low了,平均值并不能够说明什么实质问题,在这里可以用方差分析。
2、选取适当的统计方法,计算对应的统计量,这里的统计方法有t检验、卡方检验、F检验等等。
3、求得P值(其实就是原假设发生的概率),确定结论
若P≤α(置信度,就是上述说的0.05),就拒绝原假设,意思就是样本之间没差异的概率小于5%,那就认为是小概率事件,因为小概率事件基本不发生(比如我买一次彩排就中奖了,我刚买一次,就中奖了,那说明中奖就不是小概率事件。同理样本之间没差异是小概率事件,我不可能这次样本就无差异),所以拒绝原假设,认为样本之间有显著性差异。
总之结论就是:P≤α,有差异;P>α,无差异。

例题:

python 回归方程和回归系数 显著性检验 回归方程显著性检验p值_算法

python 回归方程和回归系数 显著性检验 回归方程显著性检验p值_算法_02