支持向量机的回归应用
本文的思想延续自 基于核方法的支持向量机的思想 ,感兴趣的同学可以移步。
本文的公式推导核部分图片截取自PRML,在此表示感谢!
- 综述
- 目标函数确定
- 增加松弛变量
- 求解
- 总结
综述
12∑n=1N{yn−tn}2−λ2∥w∥2 1 2 ∑ n = 1 N { y n − t n } 2 − λ 2 ‖ w ‖ 2
原本想按照PRML书上的思路阐述这个问题,后来觉得有点不通。觉得这种阐述方式很容易给人带来误解,下面陈述一下自己想法吧:
最终的目的是想要拟合一条曲线出来,根据现有的svm的知识如何推导呢?很容易想到支持向量所在的两条软间隔线,如果我们将这两天软间隔线收缩到一定范围内不就近似是一条曲线了吗?那好让我们就按着这个思路往下走。
目标函数确定
ε−不敏感的函数 ε − 不 敏 感 的 函 数 也就是当y(x)−t(n)<ε y ( x ) − t ( n ) < ε 认为y(x)=t(n) y ( x ) = t ( n ) 。通过这种方式我们就定义出了一个管道结构。
与前面的支持向量机一样我们现在需要,增加两个松弛变量
ξ⩾0和ξ^⩾0
ξ
⩾
0
和
ξ
^
⩾
0
,其中
ξ>0
ξ
>
0
的点对应于
tn>y(xn)+ε
t
n
>
y
(
x
n
)
+
ε
;
ξ^>0
ξ
^
>
0
的点对应于
tn>y(xn)−ε
t
n
>
y
(
x
n
)
−
ε
的数据点。观察上述图片发现点位于管道内的条件是:
y(xn)+ε>tn>y(xn)−ε y ( x n ) + ε > t n > y ( x n ) − ε
通过引入松弛变量,使得数据点可以出现在管道之外,与SVM相同这样使得模型在训练的时抵抗异常点的干扰更强。于是我们得出数据点应该满足的条件变为:
y(xn)+ε+ξ>tn>y(xn)−ε−ξ y ( x n ) + ε + ξ > t n > y ( x n ) − ε − ξ
类比支持向量机的
折页损失函数,这里的损失函数就可以写成:
C∑n=1N(ξn+ξ^n)+12∥w∥2 C ∑ n = 1 N ( ξ n + ξ ^ n ) + 1 2 ‖ w ‖ 2
求解拉格朗日方程
对除拉格朗日乘子外的变量求导:
消去变量得到对偶形式:
与SVM相同的方法我们得到对偶形式预测函数:
求解这个方程时,我们观察一下KKT条件看能得到什么有用的知识:
当然这里的两个乘子同样要满足盒限制:
观察变形后的KKT条件:
总结
在SVR确定了怎么处理回归后,其它的推导过程与SVm相同。