DS 证据理论(Dempster-Shafer envidence theory)也称为DS理论。是一种处理不确定性问题的完整理论。它不仅能够强调事物的客观性,还能强调人类对事物估计的主观性,其最大的特点就是就是对不确定性信息的描述采用“区间估计”,而非“点估计”,在区分不知道和不确定方面以及精确反映证据收集方面显示出很大的灵活性。
优点:
1、证据理论需要的先验数据比概率推理理论中的更直观和容易获得;
2、可以综合不同专家或数据源的知识和数据;
3、对于不确定性问题的描述很灵活和方面。
缺点:
1、证据需要是独立的(有时候不容易满足);
2、证据合成理论没有坚固的理论基础,合理性和有效性争议大;
3、计算上存在潜在的指数爆炸。
不过以上缺点都有相关的理论去改善原来的模型理论,提高普适性。
在讲解具体的理论之前,有必要先说一下DS理论到底是啥,有啥用。通俗说(不必咬文嚼字,对于理解理论足够了):有一个村庄失窃了,抓到了两个嫌疑人A和B,那么一共有四种情况:A和B都没有偷窃,A是小偷,B是小偷,A和B合伙作案。现在有三个证人村民,他们只是看到了整个案件的部分过程,并没有全部的目击真个现场,所以对究竟是哪一个情况,有不同的判断,判断结果用概率表示(概率越大那么表示该情况发生的概率越大):
结果 | 村民1 | 村民2 | 村民3 |
null | 0 | 0 | 0 |
A | 0.96 | 0.02 | 0.04 |
B | 0.03 | 0.97 | 0.02 |
A or B | 0.01 | 0.01 | 0.94 |
而DS理论要解决的问题就是,如何综合这三个村民提供的证据来判断到底属于哪一种情况。以上大致说明了DS理论到底是用来干啥的,有什么具体的应用。现在我们对DS证据理论已经建立了基本的概念。下面就要说明一下,DS理论是如何操作的。
下面说几个概念:
1、识别框架(或称为假设空间):就是我们要判断事件发生情况的范围,上面那个例子中,识别空间就是:A和B都没有偷窃,A是小偷,B是小偷,A和B合伙作案这四种情况;
2、基本概率分配(Basic Probability Assignment,BPA):确定每一个村民对这个四种情况分别对应的概率判断为多少。也就是确定每一个证人对每一种情况的基本概率为多少。可以看出:同一个证人(村民)对不同情况的概率判断之和应该为1;对于null(就是都不是)的判断都为0。而这个分配概率称之为mass函数,(把几个证人(这里指的是村民)的概率判断进行组合,称之为组合mass,链接有详细的计算过程和公式)。
3、信度函数(belief function):某个事件的信度函数指的是该事情所有的子集概率之和。
4、似然函数(plausibility fuction):某事件的似然函数指的是与该事件交集不为空的概率之和。
详细的计算过程,可以参考:
1、https://wenku.baidu.com/view/8da2a02d011ca300a6c390d3.html
清楚上面的概念之后再看这两篇,会发现理解起来很容易,很快就可以掌握。在第一个连接里面,还有DS理论的完善和修整,有兴趣可以再详细查看。