非参数Bootstrap方法
- 设总体的分布未知,但按放回抽样的方法抽取了一个容量为的样本,称为Bootstrap样本或称为自助样本。独立地取多个Bootstrap样本,利用这些样本信息对总体进行推断,这种方法称为非参数Bootstrap方法,又称为自助法。这一方法可用于对总体知之甚少地情况。
- 优点:不需要对总体分布有任何假设,而且可以使用于小样本,且能用于各种统计量。
估计量的标准误差的Bootstrap估计
- 在估计总体位置参数时,不仅要给出的估计,还需要这一估计的标准误差,常用度量。
步骤
- 相继、独立地从已知的容量为的样本中抽出个容量为的Bootstrap样本
- 计算
式中:
估计量的均方误差的Bootstrap估计
例1
- 有30窝仔猪出生时各窝猪的存活只数为
9 8 10 12 11 12 7 9 11 8 9 7 7 8 9 7 9 9 10 9 9 9 12 10 10 9 13 11 13 9
(1)试求中位数估计的标准误差的Bootstrap估计。
(2)求均方误差的估计。
data=[9 8 10 12 11 12 7 9 11 8 9 7 7 8 9 7 9 9 10 9 9 9 12 10 10 9 13 11 13 9];
b=bootstrp(1000,@(x)quantile(x,0.5),data);%1000组样本,@(x)quantile(x,0.5)求中位数的函数,data原始数据
b_std=std(b);%计算b的标准差
b_var=mean((b-quantile(data,0.5)).^2);%求均方误差
b1=bootstrp(1000,@mean,data);%平均数
b1_mean=std(b1);
Bootstrap置信区间
- 设是来自总体容量为的样本,是一个已知的样本值。中含有位置参数,是的估计量。现在求的置信水平为的置信区间。
步骤及原理
- 独立从样本中抽出个容量为的Bootstrap样本,对于每个Bootstrap样本求出的Bootstrap估计:。
- 将估计从小到大排序:。
- 求出近似分位数使得
于是近似的有 - 记,以和分别作为分位数的估计,得到近似等式
得到的置信水平为的Bootstrap置信区间为,这种方法称为分位数法。
续例1
- 以样本均值作为总体均值的估计,以标准差作为总体标准差的估计,按分位数法求的置信水平为0.90的Bootstrap置信区间。
b=bootci(1000,{@(x)[mean(x),std(x)],data},'alpha',0.1)%bootci得到Bootstrap置信区间
结果:第一列是均值的置信区间,第二列是标准差的置信区间
b =
9.0667 1.4368
10.0667 2.0609
参数Bootstrap方法
- 假设所研究的总体的分布函数的形式已知,但其中高喊未知参数。现在已知有一个来自总体的样本。
步骤
- 由该样本得到的极大似然估计。
- 在总体分布为中产生个容量为的样本
- 用非参数Bootstrap置信区间的方法得到的Bootstrap置信区间。
例2:
- 已知某电子原件的寿命服从威布尔分布,其分布函数如下
已知参数。今有样本142.84 97.04 32.46 69.14 85.67 114.43 41.76 163.07 108.22 63.28。
(1)确定参数的最大似然估计。
(2)对于时刻,求可靠性的置信水平为0.95的Bootstrap单侧置信区间。
解:
(1)求似然估计是概率论中的基础,不在此详细阐述,结果为。
(2)对于参数,产生服从对应韦布尔分布的5000个容量为10的Bootstrap样本。
对于每个样本计算的Bootstrap估计。
将5000个自小到大排列,取坐起第250([5000×0.05]=250)位,得。
所以置信水平位0.95得Bootstrap单侧置信下限为。
clc,clear
a=[142.84 97.04 32.46 69.14 85.67 114.43 41.76 163.07 108.22 63.28];
eta=sqrt(mean(a.^2));
beta=2;B=5000;alpha=0.05;
b=wblrnd(eta,beta,[B,10]);%产生shape=(B,10)的韦布尔分布的随机数
etahat=sqrt(mean(b.^2,2));%计算每个样本对应的最大似然估计
seteta=sort(etahat);%把etahat从小到大排序
k=floor(B*alpha);%取整数部分
se=seteta(k);%提取相应位置的估计量
Rt0=exp(-(50/se)^2);