实例:
背景:
制药公司:
制药公司断言他们的神药能在两周内治愈90%的患者,对于深受打鼾困扰的人来说,这可是个天大的好消息。问题是,并非人人都信服这个断言。
外科医生:
统计邦外壳诊所的医生给病人开了鼾克,但她对结果感到失望。她决定自行对药物进行试验。
她随机抽取了15位鼻鼾患者,对这些患者实施为期2周的鼾克治疗。两周后,她请这些患者来医院复诊,看他们是否不再打鼾。
结果如下:
问题:
如果药物能治愈90%的鼻鼾患者,那15的90%应该是13.5,因此你可以期望治愈14名患者,而医生的抽样中只有11名患者治愈,这比期望的结果小很多。
问题出在哪?
制药公司的断言有误差。
制药公司对鼾克进行的检验可能有缺陷,或者说有偏差,以致于对总体做出了不准确的预测。
如果鼾克的治愈率实际上低于90%,那么就能解释为什么样本中只有11人治愈。
制药公司的断言实际上是准确的。
医生的样本可能存在某种偏倚,要不然就是因为样本中的患者数目较少。
我们该如何裁决医生与制药公司之间的矛盾说法?
我们权且相信制药公司的断言,可是一旦出现强有力的反驳证据,我们就改为站到医生一边。
具体做法:
假设检验六步骤
第1步:确定假设
原假设(H0):
即你要对其进行检验的断言,除非有足够的证据进行反驳,否则你将接受这个断言。
鼾克的原假设即制药公司的断言:鼾克能在两周内治愈90%的患者。除非我们有足够的证据进行反驳,否则应认同这个断言。
我们需要检验鼻鼾药物是否至少能治愈90%的患者,因此原假设为:p=90%。
备择假设(H1):
与原假设对立的断言被称为备择假设,用H1表示。如果有足够的证据拒绝H0,我们就接受H1。
鼾克的备择假设就是证实制药公司的断言有假后要认同的另一断言。
如果有足够的证据反驳制药公司的断言,那么有可能医生的断言是对的。
医生认为鼾克治愈的患者少于90%,即备择假设为:p<90%。
第2步:选择检验统计量
我们做假设检验的目的是检验鼾克是否能治愈90%以上的患者。如果用X表示样本人数,就可以将X作为检验统计量。X符合二项分布,于是检验量实际上符合:
X~B(15,0.9)
取样本结果,然后计算发生这个结果的概率,我们通过求拒绝域实现这个目标。
第3步:确定拒绝域
何时能够拒绝制药公司的断言?
我们需要用过某种方法指出何时能够合理地拒绝原假设--指定一个拒绝域即可实现这一目的。如果鼻鼾患者的治愈人数位于拒绝域以内,我们就说有足够证据可以反驳原假设;如果鼻鼾患者的治愈人数位于拒绝域以外,我们就承认没有足够的证据可以反驳原假设,并接受制药公司的断言。我们把拒绝域的分界点称为"c"--临界值。
如何选择临界值?
定显著性水平
检验的显著性水平所量度的是一种愿望,即:希望在样本结果的不可能程度达到多大时,就拒绝原假设H0。
例如,假设我们想以5%为显著性水平检验制药公司的断言,这说明我们选取的拒绝域应使得"鼻鼾患者治愈人数小于c"的概率小于0.05,即概率分布最低端的5%部分。
拒绝域分类:单尾检验 or 双尾检验
第4步:求出p值
第5步:样本结果位于拒绝域中吗?
第6步:做出决策
增大样本量:
第1步:确定假设
第2步:选择检验统计量