联合概率
所谓联合概率就是把两个事务关联起来,他们的各个状态组合的概率分别是多少
经典的例子有抛硬币和掷色子的组合
x为色子掷出的点数,y=0意味着硬币正面朝下,反之y=1
x=1 | x=2 | x=3 | x=4 | x=5 | x=6 | |
y=1 | 1\12 | 1\12 | 1\12 | 1\12 | 1\12 | 1\12 |
y=0 | 1\12 | 1\12 | 1\12 | 1\12 | 1\12 | 1\12 |
当两个事件互不影响的时候,即可满足下列公式
P(x=1) = P(x=1 ,1 y=1) + P(x=1 ,1y=0)
则我们可以推导出
x ∈ A , y ∈ B
P(x=a) = ∑2 [B] P(x=a,y=b)
把关于x=a的所有联合概率相加可得x=a的概率
条件概率
条件概率意味着在发生某事件的前提下,另一个事件的发生概率为多少,如果说联合概率的关联符号是 ,1,那么条件概率的关联符号则是 |3
举个例子
我现在手上有16张扑克牌分别为
J | J | A | 2 |
3 | 4 | K | K |
Q | A | 3 | 4 |
5 | J | Q | K |
现在这16张牌里面,显而易见的是(直接数出来),P(X=字母)=10/16=5/8,P(Y=红色)=9/16
那么我们首先求出他们的联合概率为(例如:P(x=字母,y=红色) = 红色字母数/16)
x=字母 | x=数字 | |
y=红色 | 3/8 | 3/16 |
y=黑色 | 1/4 | 3/16 |
我们可以看出 P(x=字母,y=红色)=3/8,那么以y=红色为前提下的x=字母的概率是多少呢
P(x=字母 |3y=红色)= 6/9 = 2/3(红色字母/红色卡牌数)
P(y=红色 |3x=字母)= 6/10 = 3/5 (红色字母卡牌数/字母卡牌数)
这时,发现了一件有趣的现象,
P(x=字母,y=红色) = P(x=字母 |y=红色) *P(Y=红色) = 2/3 * 9/16=3/8
P(x=字母,y=红色) = P(y=红色 |x=字母) *P(x=字母) = 3/5 * 5/8 = 3/8
由此,我们可以得出条件概率相关的公式
P(X,Y) = P(X|Y) * P(Y)=P(Y|X) * P(X)
现在我们再来深入思考一下,X(是字母还是数字)和Y(是红色还是黑色)这两个事件是否独立呢?
我们再来回顾一下第一个经典的硬币与色子的例子
P(x=硬币朝上,y=色子掷出点数为1) = P(x=硬币朝上)*P(y=色子掷出点数为1)= 1/12
同样我们可以看到
P(x=字母,y=红色) ≠ P(Y=红色) * P(x=字母)
则可以得出,当两个事件互不相关,互不影响时满足公式
P(X,Y) = P(X) * P(Y)
结合条件概率的公式(P(X,Y) = P(X|Y) * P(Y)=P(Y|X) * P(X))可得
P(X|Y) = P(X) 或 P(Y|X) = P(Y)(X,Y互不相关)
当然,即使两个事件有所关联,也满足联合概率公式
x ∈ A , y ∈ B
P(x=a) = ∑2 [B] P(x=a,y=b)
总结
我觉的以上理论可以通过已有概率统计两件事情之间的关联程度,可以用于程序的判断分析,也可通过直接判断两件事情之间是否关联,套用公式直接得出相关概率
- 逗号在公式中代表着联合 ↩︎ ↩︎ ↩︎
- 求和符号,在一定区间内对该变量的所有计算结果进行求和 ↩︎ ↩︎
- 分割符在公式中代表着条件,| 的前面是结果,后面是前提或者条件 ↩︎ ↩︎ ↩︎