文章目录

  • ​​1. 泊松分布​​
  • ​​1.1 定义和性质​​
  • ​​1.2 理解泊松分布​​
  • ​​1.2.1 从二项分布角度理解​​
  • ​​1.2.2 直观理解​​
  • ​​1.3 分布律曲线​​
  • ​​2. 指数分布​​

1. 泊松分布

1.1 定义和性质

  • 泊松分布​:设非负的离散随机变量 概率论 —— 泊松分布和指数分布_指数分布 取值为 0,1,2,… 分布律为
    概率论 —— 泊松分布和指数分布_二项分布_02 则称 概率论 —— 泊松分布和指数分布_指数分布 服从参数为 概率论 —— 泊松分布和指数分布_方差_04 的泊松分布,记做 概率论 —— 泊松分布和指数分布_方差_05
  • 服从参数为 概率论 —— 泊松分布和指数分布_方差_04 的泊松分布的随机变量 概率论 —— 泊松分布和指数分布_方差_05 的期望和方差为
    概率论 —— 泊松分布和指数分布_方差_08
  1. 期望证明如下
    概率论 —— 泊松分布和指数分布_泊松分布_09 其中倒数第三个等号用到泰勒展开 概率论 —— 泊松分布和指数分布_方差_10
  2. 方差证明如下
    概率论 —— 泊松分布和指数分布_方差_11

1.2 理解泊松分布

1.2.1 从二项分布角度理解

  • 泊松分布可以理解为极限情况下的二项分布。伯努利实验中一个事件有 概率论 —— 泊松分布和指数分布_指数分布_12 的概率发生,概率论 —— 泊松分布和指数分布_指数分布_13 的概率不发生(例如抛硬币),二项分布就是独立重复 概率论 —— 泊松分布和指数分布_泊松分布_14 次伯努利试验后事件发生次数的概率分布,其分布律为
    概率论 —— 泊松分布和指数分布_指数分布_15 考虑 概率论 —— 泊松分布和指数分布_泊松分布_16 的极端情况,并且要求二项分布期望 概率论 —— 泊松分布和指数分布_泊松分布_17 是一个常数(这意味着 概率论 —— 泊松分布和指数分布_二项分布_18 无穷大的程度 概率论 —— 泊松分布和指数分布_泊松分布_19,把 概率论 —— 泊松分布和指数分布_指数分布_20 带回到上述分布律并取 概率论 —— 泊松分布和指数分布_指数分布_21,得到
    概率论 —— 泊松分布和指数分布_泊松分布_22 这样就推出了泊松分布的分布律

注意上面最后一个等号使用了重要极限 概率论 —— 泊松分布和指数分布_二项分布_23

1.2.2 直观理解

  • 直观上看,泊松分布描述指定时间长度时间内某事件发生次数的分布。举例来说,现在我们观察到 概率论 —— 泊松分布和指数分布_二项分布_24 分钟内停车场进入了 概率论 —— 泊松分布和指数分布_指数分布_25
  1. 把这 概率论 —— 泊松分布和指数分布_二项分布_26 分钟均匀分成长 概率论 —— 泊松分布和指数分布_泊松分布_27 分钟的 概率论 —— 泊松分布和指数分布_指数分布_28 段,每一段时间都成为一个来车概率为 概率论 —— 泊松分布和指数分布_指数分布_29
  2. 概率论 —— 泊松分布和指数分布_泊松分布_30 时每个时间段长度 概率论 —— 泊松分布和指数分布_二项分布_31,于是每段内来车概率 概率论 —— 泊松分布和指数分布_指数分布_32
  3. 根据观测结果,我们知道这 概率论 —— 泊松分布和指数分布_指数分布_28 次伯努利实验满足 概率论 —— 泊松分布和指数分布_指数分布_34

于是,概率论 —— 泊松分布和指数分布_二项分布_26 分钟内停车场进入了 概率论 —— 泊松分布和指数分布_方差_36 辆车” 这个观测,意味着 “停车场 概率论 —— 泊松分布和指数分布_二项分布_26 分钟内来车次数” 服从参数为 概率论 —— 泊松分布和指数分布_二项分布_38
概率论 —— 泊松分布和指数分布_泊松分布_39

  • 上面是从一次单独的观测中导出泊松分布,只能考察固定时间长度内事件发生次数的分布规律;如果我们宏观上知道事件发生的频率,则能同时考察任意时间长度内事件发生次数的分布规律,这相当于大量宏观观测导出大量泊松分布的平均。设停车场来车的频率为 概率论 —— 泊松分布和指数分布_泊松分布_40,长度为 概率论 —— 泊松分布和指数分布_指数分布_41 的时间内来车数量的期望就是 概率论 —— 泊松分布和指数分布_指数分布_42,这时泊松分布也可以表示为
    概率论 —— 泊松分布和指数分布_方差_43 这里 概率论 —— 泊松分布和指数分布_方差_44
  1. 某停车场平均每分钟来车数量
  2. 某医院平均每小时出生婴儿数量
  3. 某公司平均每10分钟接到电话数量

1.3 分布律曲线

  • 如下绘制泊松分布曲线
from scipy import stats
import numpy as np
import matplotlib.pyplot as plt

poisson1 = stats.poisson.pmf(np.arange(50), 1)
poisson2 = stats.poisson.pmf(np.arange(50), 2)
poisson5 = stats.poisson.pmf(np.arange(50), 5)
poisson10 = stats.poisson.pmf(np.arange(50), 10)
poisson25 = stats.poisson.pmf(np.arange(50), 25)
poisson40 = stats.poisson.pmf(np.arange(50), 40)


x = np.arange(50)
plt.plot(x, poisson1, label="λ=1")
plt.plot(x, poisson2, label="λ=2")
plt.plot(x, poisson5, label="λ=5")
plt.plot(x, poisson10, label="λ=10")
plt.plot(x, poisson25, label="λ=25")
plt.plot(x, poisson40, label="λ=40")

plt.legend()
  • 可见泊松分布是非对称的,概率论 —— 泊松分布和指数分布_指数分布_45 值越小越偏倚,随着 概率论 —— 泊松分布和指数分布_指数分布_45
  1. 概率论 —— 泊松分布和指数分布_方差_47 越小,意味着事件发生次数的期望越小(从二项分布角度考虑),考虑极限情况事件几乎不可能发生,那么事件多次发生就更加不可能,概率全部分配到发生次数 概率论 —— 泊松分布和指数分布_二项分布_48
  2. 概率论 —— 泊松分布和指数分布_方差_47

2. 指数分布

  • 指数分布是事件发生间隔的概率分布,下面这些都属于指数分布:
  1. 某停车场来车的时间间隔
  2. 某医院出生婴儿的时间间隔
  3. 某公司接到电话数量的时间间隔
  • 指数分布的公式可以从泊松分布推断出来:下一次事件发生间隔时间 概率论 —— 泊松分布和指数分布_泊松分布_50 等价于 概率论 —— 泊松分布和指数分布_泊松分布_50 时间内事件一次也没发生,于是
    概率论 —— 泊松分布和指数分布_指数分布_52 指数分布的图像通常如下