• 概要
  • 通过线性模型进行二分类
  • 随机梯度下降
  • 通过逻辑回归进行多分类
  • 多分类与二分类

概要

上节课讲述了逻辑回归,分析了逻辑回归的损失函数,采用了梯度下降的方式来求解。这节进行了延伸。

通过线性模型进行二分类

线性模型我们知道有线性回归以及逻辑回归。我们将三者的损失函数进行变形,设定s=wTx,因为这个表示一个加权分数。
结果如下图:

train_loss_vfl是什么_机器学习


将三者的损失函数画在图形上如下:

train_loss_vfl是什么_train_loss_vfl是什么_02


所以我们得到:

err0/1≤errsce=1ln2errce因为根据vc维理论:E0/1out(w)≤E0/1in(w)+......−−−−−√≤Escein(w)+......−−−−−√


所以呢,只要将数据采用逻辑回归得到一个比较小的值,那么就可以将二分类的损失函数降低,从而使得

E0/1out(w)降低。


所以我们是可以使用逻辑回归或者线性回归来求解二分类的。


这样直接替换的麻烦就是上界被我们放大了。


train_loss_vfl是什么_林轩田_03

所以我们一般是这样做:
1)使用线性回归初始化w
2)然后采用逻辑回归求解二分类问题。

随机梯度下降

在PLA中,我们每次更新只看犯错误的点,而在逻辑回归的梯度下降中,每次更新需要计算梯度,而计算梯度是要计算中整个资料点的。能不能也让逻辑回归每次计算只看一个点呢?
原始的式子是

wt+1=wt+η1N∑n=1Nθ(−ynwTxn)(ynxn)


原来一堆数据的平均,我们通过随机一堆数据来平均进行代替。现在只抽取一个点,这个思想被称为随机梯度。

将真正的梯度作为随机梯度的期望。这两个应该是差不多的。

随机梯度=真实的梯度+0均值的一个噪音

随机梯度的好吃就是快,简单。采用随机梯度可以应用在大数据方面以及在线学习方面。现在深度学习基本都是采用随机梯度下降方法进行优化。

采用随机梯度的后,变更改为:


wt+1=wt+ηθ(−ynwTxn)(ynxn)对比下PLA的更新方式:wt+1=wt+1∗[yn≠sign(wTxn)](ynxn)


两者进行对比之后发现采用随机梯度的逻辑回归和PLA的更新方式貌似差不多嘛。当逻辑回归的

η=1而且 wTxn比较大的时候,就差不多了。


现在还有两个问题,


1)算法什么时候该停止,采用SGD没有办法说计算整个的梯度,所以呢,不好计算整个的梯度是否为0作为条件。一般情况下就是运行我们认为够多的次数。


2)算法的

η该等于多少。这个没有明确的定义,一般采用0.1就差不多啦。

通过逻辑回归进行多分类

前面一直讲的是二分类,现在如何延伸到多分类的问题。

如下图所示,有四个类别,如何采用以前的二分类来进行多分类呢?

train_loss_vfl是什么_二分类_04


一种想法是将其中一种和其他几种分开。就是oneVSall

这样就得到如下的结果:

train_loss_vfl是什么_多分类_05


这样重复多次,就可以将各个类别分开。最后得到结果:

train_loss_vfl是什么_机器学习_06


我们可以明显的看到:

1)中间的区域,貌似都不属于任何类别

2) 部分区域会有两个分类器都说是自己。

所以直接使用0/1分类就会导致这样的问题,那么如果采用逻辑回归来进行一个概率估计呢?前面我们也证明了逻辑回归是可以用来进行分类的。

得到结果如下:

train_loss_vfl是什么_二分类_07


所以这样就使用了逻辑回归进行了多分类。采用多个逻辑回归算法,然后给出每个算法在每个点的概率,认为最大的概率就是需要的结果。

采用了这样的方法进行多分类有一些其他问题:
1)每次分类的时候,是一个对多个,当类别很多的时候,会导致类别不平衡的问题,这个时候可以采用多类别的逻辑回归。
2)任意的类似逻辑回归的算法都可以用来进行分类。

多分类与二分类

上节讲到如果采用OVA这样的算法,会导致类别不平衡的问题,那如果采用一个类别和另一个类别进行计算呢?就是OVO算法。

如下图所示:

train_loss_vfl是什么_多分类_08


这里只提取菱形和方块的分类,不采用全部的数据量,只使用这两个类别的数据,就不会导致类别不平衡的问题。

最后结果如下:

train_loss_vfl是什么_多分类_09


这个时候就需要C2n个算法。最后进行预测的时候,通过投票的方式,多者胜出。貌似这样的方法还不错哟。

那么OVA 和OVO的区别有啥呢?
1)算法数量不一样,OVA远小于OVO的
2)OVA每次元运算都要全部资料, 而OVO只需要一部分资料,OVO一次训练更快。
3)预测的时候OVA更快,因为算法量少,OVO时间长
一般来说OVO还是比较稳定的。