参考资料:电子工业出版社的《深入浅出统计学》

前言

利用样本准确地预测总体,并以一定方式说明预测结果的可靠程度,通过样本了解总体,并学习如何反过来通过总体了解样本。


本篇目录

  • 参考资料:电子工业出版社的《深入浅出统计学》
  • 前言
  • 具体内容
  • 一、总体均值的估计
  • 二、总体方差的估计
  • 三、比例的抽样分布
  • 1、比例分布的期望和方差
  • 2、比例分布的概率计算
  • 四、均值的抽样分布
  • 1、均值分布的期望和方差
  • 2、均值分布的概率计算
  • 五、中心极限定理


具体内容

一、总体均值的估计

根据C_statistic估计样本量 python实现_方差


通过上图可以看出,一个好的样本的均值总是和总体的均值大致相当,因此我们可以用样本的均值根据C_statistic估计样本量 python实现_中心极限定理_02来表示总体均值的点估计量。

根据C_statistic估计样本量 python实现_概率论_03

根据C_statistic估计样本量 python实现_方差_04

二、总体方差的估计

根据C_statistic估计样本量 python实现_正态分布_05


如上图所示,样本的方差一般要比总体的方差小一些,因此我们需要修改样本数据的方差公式来估计总体方差。

根据C_statistic估计样本量 python实现_方差_06


值得注意的是,在拥有总体所有数据来求总体方差确切值时,我们用的公式为如下

根据C_statistic估计样本量 python实现_中心极限定理_07

根据C_statistic估计样本量 python实现_中心极限定理_08

三、比例的抽样分布

根据C_statistic估计样本量 python实现_概率论_09

根据C_statistic估计样本量 python实现_正态分布_10

1、比例分布的期望和方差

如果我们已知在总体中红色球占25%,将总体分隔成许多容量为100颗的盒,求一盒糖球中红色球有40颗及以上的概率。【利用总体求样本】

一盒容量为100颗,这说明样本大小n为100,用随机变量X代表样本中的红色糖球的数目,则X~B(n,p),其中n=100,p=0.25。设样本中的红色糖球比例根据C_statistic估计样本量 python实现_正态分布_11为一个随机变量,且根据C_statistic估计样本量 python实现_方差_12

那么我们此时便得到了比例的概率分布。此时通过推导得到其对应的期望和方差。

根据C_statistic估计样本量 python实现_正态分布_13

根据C_statistic估计样本量 python实现_方差_14

2、比例分布的概率计算

此时我们已经得到比例分布的期望和方差值,那么如何根据这些来计算比例的概率呢。

我们发现当n很大时——n>30,根据C_statistic估计样本量 python实现_正态分布_11比例分布近似正态分布,即根据C_statistic估计样本量 python实现_正态分布_16

但需要注意的是,由于总体是离散型的二项分布,因此在用正态分布近似计算时需要连续性修正。

根据C_statistic估计样本量 python实现_正态分布_17

根据C_statistic估计样本量 python实现_正态分布_18

根据C_statistic估计样本量 python实现_正态分布_19

四、均值的抽样分布

1、均值分布的期望和方差

如果所有糖球盒总体的均值为10,方差为1,即每一盒糖球数目大致为9~11之间,那么一个样本(30个糖球盒)中,其每盒糖球平均数目小于等于8.5的概率是多少。

我们已知盒装糖球的总体的均值和方差,令一个包装盒的糖球数量用X表示,随机选择的每一盒糖球都是X的一个独立观察结果,因此每一袋糖球都符合相同的分布,即如果用根据C_statistic估计样本量 python实现_中心极限定理_20代表随机选择的一袋糖球的糖球数量,则每个根据C_statistic估计样本量 python实现_中心极限定理_20的期望都是根据C_statistic估计样本量 python实现_概率论_22,方差都是根据C_statistic估计样本量 python实现_正态分布_23,其中1<=i<=30。那么此时,我们可以用$ \overline X$表示这n袋糖球的容量均值。

根据C_statistic估计样本量 python实现_正态分布_24

根据C_statistic估计样本量 python实现_正态分布_25

2、均值分布的概率计算

同比例分布一样,当n足够大时,我们可以用正态分布来近似代替均值分布,从而计算出其概率。

五、中心极限定理

根据C_statistic估计样本量 python实现_正态分布_26


中心极限定理的应用:

根据C_statistic估计样本量 python实现_概率论_27

根据C_statistic估计样本量 python实现_方差_28

根据C_statistic估计样本量 python实现_正态分布_29