概率论中讨论随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的定律。

在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。通俗地说,这个定理就是在实验不变的条件下,重复试验多次,随机事件的平率近似于它的概率。

 

方差:方差是衡量随机变量和其数学期望之间得偏离程度。

方差在统计描述和概率分布中各有不同得定义,并有不同得公式。

在统计描述中,方差涌来计算每一个变量与总体均数之间得差异。为避免出现离均差总和为零,离均差平方和受样本含量的影响,统计学采用平均离均差平方和来描述变量的变异程度。总体方差计算公式

                                                               σ²=∑(X-μ)²/N

σ²为总体方差,X为变量,μ为总体均值,N为总体例数。

实际工作中,总体均数很难得到,应用样本统计量代替总体参数,经校正后,样本方差计算公式为

                                                            S²=Σ(X-X[bar])²/(n-1)

S²为样本方差,X为变量,X[bar]为样本均值,n为样本例数。

 

在概率分布中,射X是一个离散型随机变量,若E{X-E(X)²}存在

 

方差的性质:

设C为 常数,则D(C)=0

设X是随机变量,C是常数,则有D(CX)=C²D(X),D(X+C)=D(X)

设X与Y是两个随机变量,则

频率方差VF_标准差

其中协方差

频率方差VF_大数定律_02

 

标准差:中文环境中又称为均方差,是离均差平方的算术平均是的平方根,用σ表示。标准差是方差的算术平方根。标准差能反应一个数据集得离散程度。平均数相同的两组数据,标准差未必相同。一个较小的标准差,代表这些熟知较接近平均值。

实数的标准差:假设有一组数值x1,x2,x3,...,xn,皆为实数,其平均值为

频率方差VF_概率_03

此组数值的标准差为:

频率方差VF_方差_04

正态分布:

频率方差VF_方差_05

在课程的未来修订版中添加便准正态分布的预期值为0,曲线下面积为1,标准差为1.请注意下图中标准差较小时曲线为更高。曲线下面积为1,无论您选择哪种标准偏差。 

频率方差VF_方差_06

如果您阅读有关的统计数据得更多信息,您可能会遇到偏斜和峰度这两个词。在上图中,我们绘制了红色的正态分布(标准差为2,平均值为5)。

当曲线在平均值周围完全对称时,我们说分布的偏差为0,当分布在左侧有较大尾部时,偏斜为负(当偏差为正时,偏斜为正,尾部向右侧较大)。术语峰度表示曲线与正太分布相比如何尖或平滑。比正态分布窄的曲线据说具有正峰度。这些并不是那么重要,但这两个参数将帮助我们在下一章中比较我们的数据分布与“完美”的接近程度。

频率方差VF_频率方差VF_07