目录
1 伯努利试验
1.1 什么是伯努利试验
1.2 伯努利试验相关的3种分布
2 关于0-1分布 (也称为伯努利分布 \ ab分布 \ 两点分布等)
2.1 0-1分布的基本概率和公式
2.2 0-1分布的概率分布图,pdf 和 cdf
2.3 0-1分布的期望和方差
3 几何分布
3.1 什么是几何分布
4 二项分布
4.1 什么是二项分布 和N重伯努利试验
4.2 二项分布的公式
4.3 二项分布的两个概率的概念理解
4.4 二项分布概率分布函数
4.4.1 二项分布的pdf 和cdf 如图
4.4.2 二项分布的pdf 的变化
4.5 二项分布的期望和方差
4.6 二项分布的一个例题
二项分布的概率,期望,方差
基础实验数值变化的对比
概率
期望
方差的几种计算方式对比
1 伯努利试验
1.1 什么是伯努利试验
伯努利试验
- 伯努利试验是一个有两种结果的简单试验,它的结果是成功或失败,黑或白,开或关,没有中间的立场。
- 每次试验的结果只有两个:事件发生或不发生,或多种结果归纳为高度抽象为两种
伯努利概型是一种基于独立重复试验的概率模型,它的基本特征:
- 在一组固定不变的条件下重复地做一种试验。
- 每次试验的结果只有两个:事件发生或不发生,或多种结果归纳为高度抽象为两种
- 每次试验中,相同事件发生的概率均一样。(试验样本总数和概率不能变)
- 各次重复试验的结果是相互独立,互不影响的。
- 1重伯努利试验 就是 0-1分布
- n 重伯努利试验 就是二项分布 p=C(n,k)*p^k*(1-p)^n-k
N重伯努利试验 和二项分布
优势
- 不要求具体的样本总量的具体 数量
- 只需要知道概率就行,但要求概率是稳定不变的(多次伯努利试验时)
- 还需要知道 抽样试验的次数,目标事件的次数
局限性
- 能不能用二项分布先判断,是不是符合N重伯努利试验,如果不符合就没戏
- 二项分布,伯努利试验,需要保证样本容量确定,且分布也要稳定,否则不能
- 必须是放回抽样
- 如果是不放回抽样,
- 要么认为样本极其大,忽略样本总量变化,概率变化不稳定的影响
- 要么得用超几何分布
使用时注意点
- 需要严格认识的地方:
- N次试验,每次试验都稳定,样本总数和概率都稳定才能视为N重伯努利试验,才能用二项分布
- 不放回抽样,一般不适合二项分布
- 因为小样本量前提下,不放回抽样会破坏第一次试验后的样本空间数和概率,发生变化!第2次试验无法和第1次相同了
- 如果样本量足够大,即使是不放会抽样,可以用二项分布近似
1.2 伯努利试验相关的3种分布
- 0-1分布
- 只进行1次伯努利试验的随机变量,符合0-1分布,f(x=k)=p^k*(1-p)^(1-k)
- k={0,1}
- 几何分布:
- 进行n次伯努利试验,只有最后1次成功,成功次数第N次,N符合几何分布
- f(x=k)=p*(1-p)^(k-1)
- 其中 k 是总试验次数,一共进行了k次,且第k次(也就是最后1次)成功
- 二项分布:
- 进行N次伯努利试验,有k次成功,成功次数k符合二项分布
- f(x=k)=C(n,k)*p^k*(1-p)^(n-k)
- 其中n是总试验次数,k是成功次数(对应成功的概率p)
2 关于0-1分布 (也称为伯努利分布 \ ab分布 \ 两点分布等)
2.1 0-1分布的基本概率和公式
0-1分布:只进行1次伯努利试验的随机变量,结果只有2种,符合0-1分布
一个随机事件,发生记为k=1,不发生记为k=0,若事件服从0-1分布,
则k的分布律为:
k 0 1
p(k) 1-p p
- 0-1分布的概率公式 f(x)=p^k*(1-p)^(1-k)
- k={0,1}
- 其实就是
- k=1时,f(x)=p
- k=0时,f(x)=1-p
2.2 0-1分布的概率分布图,pdf 和 cdf
- 0-1分布,因为只有1次试验
- 只有两种结果
- 所以分布图看起来就是这种直线。。。。
k | p1 | p2 | p3 | p4 | p5 | |
pdf | 0 | 0.9 | 0.8 | 0.5 | 0.2 | 0.1 |
1 | 0.1 | 0.2 | 0.5 | 0.8 | 0.9 | |
cdf | 0 | 0.9 | 0.8 | 0.5 | 0.2 | 0.1 |
1 | 1 | 1 | 1 | 1 | 1 |
2.3 0-1分布的期望和方差
- E(X) = 0*(1-p)+1*p = p
- D(X) = p*(1-P)
- 缺少证明过程
3 几何分布
3.1 什么是几何分布
几何分布就是一种定义为:在n次伯努利试验中,试验k次才得到第一次成功的机率。
详细地说是:前k-1次皆失败,第k次成功的概率。
- 首先几何分布,属于古典概型/ 伯努利试验
- 特点是:只有每次试验只可能有两种结果
- 如果只做1次试验,那是属于0-1分布,但是如果做N次试验,但是只有最后一次成功,则随机变量符合 几何分布,但是如果做N次试验,没其他限制,则随机变量符合 二项分布
- 由上可知,0-1分布,几何分布,应该都可以归纳为,二项分布的一种特例。
4 二项分布
4.1 什么是二项分布 和N重伯努利试验
- 在概率论和统计学中,二项分布是n个独立的成功/失败试验中成功的次数的离散概率分布,
- 其中每次试验的成功概率为p。
- 其实,只有符合N重伯努利试验的随机变量,才可能服从二项分布!
- 二项分布包含0-1分布和几何分布
- 当n=1时,二项分布就是伯努利分布,也就是0-1分布,如果只有最后一次成功又是几何分布。
4.2 二项分布的公式
- 一般地,如果随机变量服从参数为和的二项分布,我们记为或。n次试验中正好得到k次成功的概率由概率质量函数给出:
- p(x=k)=C(n,k)*p^k*(1-p)^(n-k)
- 其中n是总试验次数,k是成功次数(对应成功的概率p)
- 式中k=0,1,2,…
- 而C(n,k)= n!/(n-k)!*k! 是二项式系数,(这就是二项分布名称的由来)
- 该公式可以用以下方法理解:我们希望有k次成功(p)和n−k次失败(1 −p)。
- 并且,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有个C(n,k)不同的方法。
4.3 二项分布的两个概率的概念理解
- 二项分布,指的是N次试验里成功k次的概率符合二项分布
- 而内部的单次试验,是伯努利试验,其单次试验的概率p,是稳定不变的。
- N 次试验里成功k次的概率的 k~~p(k) 情况
- p(k) 是 表示多次试验,且要求(n次出k次成功)的概率
- p(k) 和单次试验的概率P不要混淆
4.4 二项分布概率分布函数
4.4.1 二项分布的pdf 和cdf 如图
- 二项分布的pdf
- 二项分布的cdf
4.4.2 二项分布的pdf 的变化
先看下整体图
- 纵向是,单次伯努利试验的p提升
- 横向是,试验次数n的增加
- 内部里面是,坐标系的横轴是 n次试验成功次数k,k的概率变化
纵向看
- 在总试验次数不变的前提下,随着 单次伯努利试验里,概率p的增加
- 整个二项分布的波峰逐渐右移,意味着,波峰是概率最高的次数逐渐变大(概率越大,n次试验内成功k次,k也会越大,符合直觉)
- 概率很小的时候,可能只成功0次,1次的概率很大,
- 概率很大的时候,试验n次,k次成功的k越来越大,甚至接近n了
横向看
- 在单次伯努利试验里,概率p不变的前提下,随着试验次数的增多
- 整个二项分布的波峰逐渐右移,意味着,波峰是概率最高的次数逐渐变大(概率不变,n次试验内成功k次,试验次数n越多,k也会越大,符合直觉)
- 但是概率不变前提下, 虽然成功的次数k变多了,但比例并不变(因为基础的单次伯努利试验的概率没变,这是横向变化的前提)
4.5 二项分布的期望和方差
- 二项分布的期望
- E(X)=n*p
- 二项分布的方差
- D(X)=n*p*(1-P)
缺乏推导过程
4.6 二项分布的一个例题
- 如果像利用二项分布,需要灵活的去划分样本空间为2种结果,比如例题中的
- 这样划分2种:这次抽样后需要调整机器 == 对应的变量是本次检验,次品数量>1
- 今天某次检查次品数>1==今天需要调整机器 / 对立今天不调整机器
- 每天检查4次,相当于做了4次伯努利试验
- 方法1,完全用了二项分布思路和解法
- 方法2,用了古典概型的,每次试验都是独立的,和加法原理加起来算的
- 注意,为了达到目标事件,事件可能需要几次户型转化,随机变量可能要转化几次
二项分布的概率,期望,方差
基础实验数值变化的对比
基础试验概率p=0.05 时
基础试验概率p=0.7 时
概率
期望
期望的几种计算方式对比
方差的几种计算方式对比