目录
1、Mann-whitney 算法简介
2、定义
3、Mann-whitney 算法步骤
4、matlab函数
5、实例及matlab代码
独立双样本的非参数检验,不满足正态分布的小样本,秩和检验 X Y样本数量可以不相等
参考链接:
1、Mann-whitney 算法简介
曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的 [1] 。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。
2、定义
曼-惠特尼U检验(Mann-Whitney U test)曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的独立双样本T检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,它比符号检验法使用了更多的信息。
3、Mann-whitney 算法步骤
具体步骤如下:
第一步: 将两组数据混合,并按照大小顺序编排等级。最小的数据等级为 1,第二小的数据 等级为 2,以此类推(若有数据相等的情形,则取这几个数据排序的平均值作为其等级)。
{1, 3, 3, 7}对应等级{1, 2.5, 2.5, 4}
第二步: 分别求出两个样本的等级和 W1、 W 2。
第三步: 计算曼 -惠特尼 U 检验统计量, n1 为第一个样本的量, n2 为第二个样本的量:
N=n1+n2
W1+W2=N(N+1)/2
So U1+U2=n1n2
选择 U1 和 U2 中最小者与临界值 Ua比较,当 U < Ua 时,拒绝 H0,接受 H1。在原假设为真的情况下, 随机变量 U 的均值和方差分别为,当 n1 和 n2都不小于 10 时,随机变量近似服从正态分布:
第四步: 作出判断。设第一个总体的均值为 μ 1,第二个总体的均值为 μ 2,则有:
4、matlab函数
MATLAB统计工具箱中提供了ranksum函数,用来做秩和检验,其调用格式如下:
[p,h,stats]=ranksum(x,y,param1,val1,........)
根据样本观测值向量x和y做双侧秩和检验,原假设两独立样本x和y来自于具有相同中位数的连续分布,备择假设是x和y具有不同的中位数。此时可选成对出现的参数和参数值来控制计算结果。可选的参数名与参数值如下表:
参数名 参数值及说明
'alpha' 检验的显著性水平,其取值介于0--1
默认值为0.05
‘method’ 指定计算p值的方法,可能的取值情况如下
‘exact’:利用精确方法计算p值,适用于小样本(样本容量<10)情形
‘approximate’:利用正态近似计算p值,适用于大样本情形
输出参数分别为检验的p值、变量h和包含检验统计量信息的结构体变量stats,当p>a(显著性水平)或h=0时,接受原假设;当p<=a或h=1时,拒绝原假设。
5、实例及matlab代码
下面是两种不同加工方式的菜粕在黄牛瘤胃内培养16h的干物质降解率,用曼-惠特尼U检验比较其有无差异:
两种加工方式的菜粕瘤胃培养 16h的干物质降解率(%)
先按照大小顺序排列等级(见上表),而后计算 W1 = 38, W2 = 67, n1 = 6, n2 = 8。
假设两种菜粕的16h瘤胃干物质降解率除了平均水平以外在其它方面无差异,即检验:
H0:两种菜粕的16h瘤胃干物质降解率无差异;
H1:两种菜粕的16h瘤胃干物质降解率有差异。
计算U值:
%第一组
x=[39.33,44.10,35.89,43.35,47.61,43.71];
%第二组
y=[42.91,44.69,44.54,45.31,37.73,48.75,46.71,41.85];
%调用ranksum进行检验
[p,h,stats]=ranksum(x,y,'method','exact')
p =
0.4136
h =
0
函数返回p=0.4136>0.05,U2值较小,选取 U2与 Uα(α=0.05)比较,通过查表(附表)可知 Uα = 8, U2 > Uα,即接受 H0,认为两种加工方式的菜粕瘤胃培养16h的干物质降解率无显著差异