6.3 二项式检验

SPSS 统计分析从入门到精通(第2版)
在处理实际问题时,有些数据的取值只能划分为两类,比如医学中的生与死、患病的有与无。从这种二分类总体中抽取的样本,要么是对立分类中的这一类,要么是另一类,其频数分布服从二项分布。二项式检验(Binomial test),就是一种用来检验样本是否来自参数为(n,p)的二项分布总体的方法。

6.3.1 原理与方法

二项式检验通过对二值变量的单个取值做检验,能够判断总体中两个类别个体的比例是否分别为p和1−p。参数为(n,p)的二项分布满足:P(X = k) = C_k^n{p^k}{(1 - p)^{n - k}},其均值和标准差分别为np和

二项式检验R语言代码 二项检验公式_二项式检验R语言代码


。其中P(X=k)表示所占比例为p的类别出现k次的概率。SPSS中二项式检验的统计量定义为

二项式检验R语言代码 二项检验公式_取值_02

其中n1为第一个类别的样本个数。随着样本量n的增大,p1渐进趋于正态分布,故可用正态分布来检验统计量p1的显著性。

6.3.2 数据和问题描述

利用某企业生产某种产品的合格率数据,检验其合格产品数量是否服从参数为p的二项分布。所用数据来自随盘文件“Chapter 06产品合格率二项检验.sav”,数据格式如图6-8所示。


二项式检验R语言代码 二项检验公式_二项式检验R语言代码_03



本例检验的原假设为H0:合格产品比率等于0.8;备择假设为H1:合格产品比率不等于0.8。

6.3.3 二项式检验实例分析

依次单击菜单“分析→非参数检验→旧对话框→二项式…”,执行二项式检验过程,其主设置界面如图6-9所示。

1.参数设置

在左侧的变量列表单击选中“是否合格”变量,单击

二项式检验R语言代码 二项检验公式_二项式检验R语言代码_04

按钮,将其指定为检验变量;在“检验比例”后面的输入框键入0.80,作为检验概率值。

二项式检验R语言代码 二项检验公式_数据_05



boll 检验变量列表:需为数值型二分类变量;若同时选入了多个,将分别单独处理。

boll “定义二分法”栏:设置数据分为两个类别的方式,有两个选项:“从数据中获取”,表示从数据直接获取,为默认选项;“割点”,由用户指定一个临界值,检验变量的取值大于此临界值的观测归为一个类别,其他的归为另一个类别。

boll “检验比例”输入框:指定待检验的期望概率值,它对应数据中第一个类别的概率值。系统默认将第一个记录行的变量取值作为第一个类别,另一个值归为第二个类别。由于本例的数据编辑器窗口中第一个记录为“(代表合格),所以检验问题的零假设就是“合格率等于。

单击“选项”按钮,将弹出如图6-5所示的选项设置对话框;单击“精确”按钮,将弹出如图6-6所示的精确检验设置对话框。其设置选项的含义和设置方法同前。

2.结果分析
在图6-9中,单击“确定”按钮运行,SPSS查看器窗口的输出表格如图6-10所示。


二项式检验R语言代码 二项检验公式_取值_06



由于渐进显著性的取值0.474>0.10,故而不能否定零假设,即认为产品合格比率与0.8没有显著差异。