- 参考:泊松分布是怎么来的?应该怎么用?
文章目录
- 1. 泊松分布
- 1.1 定义和性质
- 1.2 理解泊松分布
- 1.2.1 从二项分布角度理解
- 1.2.2 直观理解
- 1.3 分布律曲线
- 2. 指数分布
1. 泊松分布
1.1 定义和性质
-
泊松分布
:设非负的离散随机变量 取值为 0,1,2,… 分布律为
则称 服从参数为 的泊松分布,记做 - 服从参数为 的泊松分布的随机变量 的期望和方差为
- 期望证明如下
其中倒数第三个等号用到泰勒展开 - 方差证明如下
1.2 理解泊松分布
1.2.1 从二项分布角度理解
- 泊松分布可以理解为极限情况下的二项分布。伯努利实验中一个事件有 的概率发生, 的概率不发生(例如抛硬币),二项分布就是独立重复 次伯努利试验后事件发生次数的概率分布,其分布律为
考虑 的极端情况,并且要求二项分布期望 是一个常数(这意味着 无穷大的程度 ,把 带回到上述分布律并取 ,得到
这样就推出了泊松分布的分布律
注意上面最后一个等号使用了重要极限
1.2.2 直观理解
- 直观上看,泊松分布描述指定时间长度时间内某事件发生次数的分布。举例来说,现在我们观察到 分钟内停车场进入了
- 把这 分钟均匀分成长 分钟的 段,每一段时间都成为一个来车概率为
- 时每个时间段长度 ,于是每段内来车概率
- 根据观测结果,我们知道这 次伯努利实验满足
于是,“ 分钟内停车场进入了 辆车” 这个观测,意味着 “停车场 分钟内来车次数” 服从参数为
- 上面是从一次单独的观测中导出泊松分布,只能考察固定时间长度内事件发生次数的分布规律;如果我们宏观上知道事件发生的频率,则能同时考察任意时间长度内事件发生次数的分布规律,这相当于大量宏观观测导出大量泊松分布的平均。设停车场来车的频率为 ,长度为 的时间内来车数量的期望就是 ,这时泊松分布也可以表示为
这里
- 某停车场平均每分钟来车数量
- 某医院平均每小时出生婴儿数量
- 某公司平均每10分钟接到电话数量
1.3 分布律曲线
- 如下绘制泊松分布曲线
- 可见泊松分布是非对称的, 值越小越偏倚,随着 。
- 越小,意味着事件发生次数的期望越小(从二项分布角度考虑),考虑极限情况事件几乎不可能发生,那么事件多次发生就更加不可能,概率全部分配到发生次数
2. 指数分布
- 指数分布是事件发生间隔的概率分布,下面这些都属于指数分布:
- 某停车场来车的时间间隔
- 某医院出生婴儿的时间间隔
- 某公司接到电话数量的时间间隔
- 指数分布的公式可以从泊松分布推断出来:下一次事件发生间隔时间 等价于 时间内事件一次也没发生,于是
指数分布的图像通常如下