文章目录

  • 6.3 朴素贝叶斯估计
  • 6.3 朴素贝叶斯估计
  • 6.3.1 原理
  • 离散属性
  • 连续属性
  • 6.3.2 具体流程
  • 6.3.3 拉普拉斯修正


6.3 朴素贝叶斯估计

6.3 朴素贝叶斯估计

  • 基于第一章 的贝叶斯准则,将条件风险转化为了先验概率和似然。
  • 又基于第二章 极大似然估计获得了通过优化似然函数得到极大似然估计的方法。
  • 采用“属性条件独立性假设”:假设每个属性独立地对分类结果发生影响。

6.3.1 原理

朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法

基于贝叶斯公式来估计后验概率【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率的主要困难在于:类条件概率【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_02是所有属性上的联合概率,难以从有限的训练样本直接估计而得。

(基于有限训练样本直接估计联合概率,在计算上斗争会遭遇纽合爆炸问题,在数据上将会遭遇样本稀疏问题,属性数越多,问题越严重.)

为避开这个障碍,朴素贝叶斯分类器(naÏve Bayes classifier)采用了"属性条件独立性假设" (attribute conditional independence assumption): 对已知类别,假设所有属性相互独立.换言之,假设每个属性独立地对分类结果发生影响.

基于属性条件独立性假设。根据式子【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_03可以重写为

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_04

其中【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_05为属性数目, 【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_06【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_07在第【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_08个属性上的取值。

由于对所有类别来说【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_09相同,因此基于式【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_10贝叶斯判定准则

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_11

这就是朴素贝叶斯分类器的表达式。

朴素贝叶斯的训练过程就是基于训练集D来估计类先验概率P©,并为每个属性估计条件概率【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_12

离散属性

对离散属性而言,令【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_13表示【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_14中在第【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_08个属性上取值为【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_06的样本组成的集合,则条件概率【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_12可估计为
【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_18

连续属性

对连续属性可考虑概率密度函数,假定【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_19,其中【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_20【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_21,分别是第【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_22类样本在第【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_08个属性上取值的均值和方差,则有
【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_24

下面是别人的PPT,写的比较好。截图了下面

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_25

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_26

为了避免其他属性携带的信息被训练集中未出现的属性值"抹去’,在估计概率值时通常要进行"平滑" (smoothing) ,常用"拉普拉斯修正" (Laplacian correction)。拉普拉斯修正实质上假设了属性值与类别均匀分布。

6.3.2 具体流程

首先看数据集。

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_27

然后我们对一个测试集进行分类

编号

色泽

根蒂

敲声

纹理

脐部

触感

密度

含糖率

好瓜

测试1

青绿

蜷缩

浊响

清晰

凹陷

硬滑

0.697

0.460


【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_07是所有样本,【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_06是每个属性,【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_22是好瓜

首先我们计算出先验概率【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_31,显然有

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_32好瓜=是【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_33

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_32好瓜=否【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_35

对每个属性估计条件概率【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_12

下面是离散值

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_37

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_38

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_39

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_40

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_41

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_42

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_43

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_44

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_45

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_46

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_47

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_48

下面是连续值

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_49

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_50

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_51

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_52

于是,好瓜

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_53
由于【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_机器学习_54.我们判断测试1位好瓜

6.3.3 拉普拉斯修正

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_55

对于此数据集,对"敲声=清脆”的测试用例。

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_56

由于连乘的公式概率值为0,不管其他分类结果如何。结果都是否。不符合常理

所以为了避免其他属性携带的信息被训练集中未出现的属性值"抹去"。常用拉普拉斯修正

令N表示训练集D中可能的类别,【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_概率论_57表示第i个属性可能的取值数。

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_朴素贝叶斯_58

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_59

所以其中类先验概率

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_条件概率_60,因为类别就两种,好瓜和坏瓜。类别为2

【机器学习之 朴素贝叶斯】6.3 朴素贝叶斯估计_分类_61,因为可以取值为清脆,浊响,沉闷。取值数为3