假设X为独立同分布的一组随机变量,总体为M,随机抽取N个随机变量构成一个样本,样本方差的无偏估计与(n-1)的由来_样本方差样本方差的无偏估计与(n-1)的由来_无偏估计_02是总的均和方差, 是常数样本方差的无偏估计与(n-1)的由来_样本方差_03是对样本的均值和方差,由于样本是随机抽取的,样本方差的无偏估计与(n-1)的由来_n-1_04也是随机的。

既然是随机变量,就可以观察他们的均值方差。

样本方差的无偏估计与(n-1)的由来_样本方差_05


这里需要注意的是,由于样本是随机的,所以X1X2X3...都是随机的。 上式中可以看出, 样本均值这个变量的期望就是总体的均值,因此可以说均值是无偏的。

接下来看样本方差的均值:

样本方差的无偏估计与(n-1)的由来_样本方差_06

根据方差公式,可以得到:

样本方差的无偏估计与(n-1)的由来_无偏估计_07

因此:

样本方差的无偏估计与(n-1)的由来_样本方差_08

这里可以看出样本方差的期望并不是无偏的,要无偏估计,应该再乘上一个系数:

所以无偏估计的样本的方差:

样本方差的无偏估计与(n-1)的由来_无偏估计_09

n-1既为自由度,就是说,在一个容量为n的样本里,当确定了n-1个变量以后,第n个变量就确定了,因为样本均值是无偏的。