定义

贝叶斯网络,是目前不确定知识表达和推理领域最有效的理论模型之一。贝叶斯网络, 由代表变量节点及连接这些节点有向边构成。

节点代表随机变量,节点间的有向边代表了节点间的互相关系,用条件概率进行表达关系强度,没有父节点的用先验概率进行信息表达。

数学定义

令 G= (I,E) 表示一个有向无环图(DAG),其中 I 代表图中所有的节点的集合,而 E 代表有向连接线段的集合,且令 X= (Xi)i∈I 为其有向无环图中的某一节点 i 所代表之随机变量,若节点 X 的联合概率分布可以表示成:

贝叶斯网络 Python包 贝叶斯网络分析_贝叶斯网络在计算机

则称 X 为相对于一有向无环图 G 的贝叶斯网络,其中 pa(i)表示节点 i 之「因」。

对任意的随机变量,其联合分布可由各自的局部条件概率分布相乘而得出:

贝叶斯网络 Python包 贝叶斯网络分析_贝叶斯网络 Python包_02

依照上式,我们可以将一贝叶斯网络的联合概率分布写成:

贝叶斯网络 Python包 贝叶斯网络分析_条件概率_03

上面两个表示式之差别在于条件概率的部分,在贝叶斯网络中,若已知其「因」变量下,某些节点会与其「因」变量条件独立,只有与「因」变量有关的节点才会有条件概率的存在。

如果联合分布的相依数目很稀少时,使用贝氏函数的方法可以节省相当大的存储器容量。举例而言,若想将 10 个变量其值皆为 0 或 1 存储成一条件概率表型式,一个直观的想法可知我们总共必须要计算 2^10=1024 个值;但若这 10 个变量中无任何变量之相关「因」变量是超过三个以上的话,则贝叶斯网络的条件概率表最多只需计算 10* 2^3=80 个值即可。

特征贝叶斯网络本身是一种不定性因果关联模型;

贝叶斯网络具有强大的不确定性问题处理能力;

贝叶斯网络能有效地进行多源信息表达与融合。