非参数Bootstrap方法

  • 设总体的分布ts function参数非必填 非参数bootstrap方法_Bootstrap未知,但按放回抽样的方法抽取了一个容量为ts function参数非必填 非参数bootstrap方法_matlab_02的样本,称为Bootstrap样本或称为自助样本。独立地取多个Bootstrap样本,利用这些样本信息对总体ts function参数非必填 非参数bootstrap方法_Bootstrap进行推断,这种方法称为非参数Bootstrap方法,又称为自助法。这一方法可用于对总体知之甚少地情况
  • 优点:不需要对总体分布有任何假设,而且可以使用于小样本,且能用于各种统计量。

估计量的标准误差的Bootstrap估计

  • 在估计总体位置参数ts function参数非必填 非参数bootstrap方法_bootstrap_04时,不仅要给出ts function参数非必填 非参数bootstrap方法_bootstrap_04的估计ts function参数非必填 非参数bootstrap方法_bootstrap_06,还需要这一估计的标准误差,常用ts function参数非必填 非参数bootstrap方法_bootstrap_07度量。

步骤

  1. 相继、独立地从已知的容量为ts function参数非必填 非参数bootstrap方法_matlab_02的样本中抽出ts function参数非必填 非参数bootstrap方法_Bootstrap_09个容量为ts function参数非必填 非参数bootstrap方法_matlab_02的Bootstrap样本

ts function参数非必填 非参数bootstrap方法_matlab_11

  1. 计算

ts function参数非必填 非参数bootstrap方法_Bootstrap_12
式中: ts function参数非必填 非参数bootstrap方法_Bootstrap_13

估计量的均方误差的Bootstrap估计

例1

  • 有30窝仔猪出生时各窝猪的存活只数为

9 8 10 12 11 12 7 9 11 8 9 7 7 8 9 7 9 9 10 9 9 9 12 10 10 9 13 11 13 9
(1)试求中位数估计ts function参数非必填 非参数bootstrap方法_matlab_14的标准误差的Bootstrap估计。
(2)求均方误差ts function参数非必填 非参数bootstrap方法_Bootstrap_15的估计。

data=[9  8  10  12  11  12  7  9  11  8  9  7  7  8  9  7  9  9  10  9  9  9  12  10  10  9  13  11  13  9];
b=bootstrp(1000,@(x)quantile(x,0.5),data);%1000组样本,@(x)quantile(x,0.5)求中位数的函数,data原始数据
b_std=std(b);%计算b的标准差
b_var=mean((b-quantile(data,0.5)).^2);%求均方误差


b1=bootstrp(1000,@mean,data);%平均数
b1_mean=std(b1);

Bootstrap置信区间

  • ts function参数非必填 非参数bootstrap方法_bootstrap_16是来自总体ts function参数非必填 非参数bootstrap方法_Bootstrap容量为ts function参数非必填 非参数bootstrap方法_matlab_02的样本,ts function参数非必填 非参数bootstrap方法_机器学习_19是一个已知的样本值。ts function参数非必填 非参数bootstrap方法_Bootstrap中含有位置参数ts function参数非必填 非参数bootstrap方法_bootstrap_04ts function参数非必填 非参数bootstrap方法_ts function参数非必填_22ts function参数非必填 非参数bootstrap方法_bootstrap_04的估计量。现在求ts function参数非必填 非参数bootstrap方法_bootstrap_04的置信水平为ts function参数非必填 非参数bootstrap方法_Bootstrap_25的置信区间。

步骤及原理

  1. 独立从样本ts function参数非必填 非参数bootstrap方法_ts function参数非必填_26中抽出ts function参数非必填 非参数bootstrap方法_Bootstrap_27个容量为ts function参数非必填 非参数bootstrap方法_matlab_02的Bootstrap样本,对于每个Bootstrap样本求出ts function参数非必填 非参数bootstrap方法_bootstrap_04的Bootstrap估计:ts function参数非必填 非参数bootstrap方法_机器学习_30
  2. 将估计从小到大排序:ts function参数非必填 非参数bootstrap方法_bootstrap_31
  3. 求出近似分位数ts function参数非必填 非参数bootstrap方法_ts function参数非必填_32使得
    ts function参数非必填 非参数bootstrap方法_Bootstrap_33
    于是近似的有
    ts function参数非必填 非参数bootstrap方法_Bootstrap_34
  4. ts function参数非必填 非参数bootstrap方法_matlab_35,以ts function参数非必填 非参数bootstrap方法_bootstrap_36ts function参数非必填 非参数bootstrap方法_Bootstrap_37分别作为分位数ts function参数非必填 非参数bootstrap方法_ts function参数非必填_32的估计,得到近似等式
    ts function参数非必填 非参数bootstrap方法_matlab_39
    得到ts function参数非必填 非参数bootstrap方法_bootstrap_04的置信水平为ts function参数非必填 非参数bootstrap方法_Bootstrap_25的Bootstrap置信区间为ts function参数非必填 非参数bootstrap方法_ts function参数非必填_42,这种方法称为分位数法。

续例1

  • 以样本均值ts function参数非必填 非参数bootstrap方法_ts function参数非必填_43作为总体均值ts function参数非必填 非参数bootstrap方法_Bootstrap_44的估计,以标准差ts function参数非必填 非参数bootstrap方法_ts function参数非必填_45作为总体标准差ts function参数非必填 非参数bootstrap方法_Bootstrap_46的估计,按分位数法求ts function参数非必填 非参数bootstrap方法_机器学习_47的置信水平为0.90的Bootstrap置信区间。
b=bootci(1000,{@(x)[mean(x),std(x)],data},'alpha',0.1)%bootci得到Bootstrap置信区间

结果:第一列是均值的置信区间,第二列是标准差的置信区间
b =
    9.0667    1.4368
   10.0667    2.0609

参数Bootstrap方法

  • 假设所研究的总体的分布函数ts function参数非必填 非参数bootstrap方法_ts function参数非必填_48的形式已知,但其中高喊未知参数ts function参数非必填 非参数bootstrap方法_ts function参数非必填_49。现在已知有一个来自总体的样本ts function参数非必填 非参数bootstrap方法_Bootstrap_50

步骤

  1. 由该样本得到ts function参数非必填 非参数bootstrap方法_ts function参数非必填_49的极大似然估计ts function参数非必填 非参数bootstrap方法_Bootstrap_52
  2. 在总体分布为ts function参数非必填 非参数bootstrap方法_ts function参数非必填_53中产生ts function参数非必填 非参数bootstrap方法_Bootstrap_09个容量为ts function参数非必填 非参数bootstrap方法_matlab_02的样本
    ts function参数非必填 非参数bootstrap方法_Bootstrap_56
  3. 用非参数Bootstrap置信区间的方法得到ts function参数非必填 非参数bootstrap方法_ts function参数非必填_49的Bootstrap置信区间。

例2:

  • 已知某电子原件的寿命服从威布尔分布,其分布函数如下
    ts function参数非必填 非参数bootstrap方法_Bootstrap_58
    已知参数ts function参数非必填 非参数bootstrap方法_Bootstrap_59。今有样本142.84 97.04 32.46 69.14 85.67 114.43 41.76 163.07 108.22 63.28。
    (1)确定参数ts function参数非必填 非参数bootstrap方法_机器学习_60的最大似然估计。
    (2)对于时刻ts function参数非必填 非参数bootstrap方法_matlab_61,求可靠性ts function参数非必填 非参数bootstrap方法_bootstrap_62的置信水平为0.95的Bootstrap单侧置信区间。
    解:
    (1)求似然估计是概率论中的基础,不在此详细阐述,结果为ts function参数非必填 非参数bootstrap方法_机器学习_63
    (2)对于参数ts function参数非必填 非参数bootstrap方法_matlab_64,产生服从对应韦布尔分布的5000个容量为10的Bootstrap样本。
    对于每个样本计算ts function参数非必填 非参数bootstrap方法_机器学习_60的Bootstrap估计ts function参数非必填 非参数bootstrap方法_matlab_66
    将5000个ts function参数非必填 非参数bootstrap方法_ts function参数非必填_67自小到大排列,取坐起第250([5000×0.05]=250)位,得ts function参数非必填 非参数bootstrap方法_ts function参数非必填_68
    所以置信水平位0.95得Bootstrap单侧置信下限为ts function参数非必填 非参数bootstrap方法_ts function参数非必填_69
clc,clear
a=[142.84  97.04  32.46  69.14  85.67  114.43  41.76  163.07  108.22  63.28];
eta=sqrt(mean(a.^2));
beta=2;B=5000;alpha=0.05;
b=wblrnd(eta,beta,[B,10]);%产生shape=(B,10)的韦布尔分布的随机数
etahat=sqrt(mean(b.^2,2));%计算每个样本对应的最大似然估计
seteta=sort(etahat);%把etahat从小到大排序
k=floor(B*alpha);%取整数部分
se=seteta(k);%提取相应位置的估计量
Rt0=exp(-(50/se)^2);