python实现损失函数绘制损失函数的优化方法

转载

字节小舞神 2023-11-29 06:55:13

文章标签 python实现损失函数绘制计算机视觉算法正则化损失函数 文章分类 Python 后端开发

CS231N斯坦福计算机视觉公开课 02 - 损失函数和优化

一、SVM铰链损失函数
二、正则化

1.引入原因

三、Softmax交叉熵损失函数
四、优化过程

1.梯度下降算法

一、SVM铰链损失函数

分类错误的分数减去分类正确的分数再加1，比较这个数和0的大小关系，取最大值
猫猫的SVM loss为：max(0 , 5.1 - 3.2 + 1) + max(0,- 1.7 - 3.2 + 1) = 2.9+0 = 2.9

python实现损失函数绘制损失函数的优化方法_损失函数

二、正则化

1.引入原因

由于同一个损失函数可以有多种变形算法（如将所有分数乘以2后再进行SVM loss计算），但是我们需要的是最简单的计算方法，所以我们引入正则化的概念
正则化可以让权重、模型在测试集上更好的泛化

正则化：
在常规损失函数的项后添加一个正则化的项，用正则化参数 $python实现损失函数绘制损失函数的优化方法_算法_02$ 表示正则化的强度
一些正则化方法
L1、L2正则化，以及它们的线性组合
Dropout正则化……

python实现损失函数绘制损失函数的优化方法_正则化_03

举例：
我们得到了 $python实现损失函数绘制损失函数的优化方法_损失函数_04$ 、 $python实现损失函数绘制损失函数的优化方法_正则化_05$ 两个权重向量，他们与输入的 $python实现损失函数绘制损失函数的优化方法_python实现损失函数绘制_06$ 的乘积是相同的
但是引入L2正则化函数后，计算出来的正则化项中， $python实现损失函数绘制损失函数的优化方法_损失函数_04$ 对应的正则化项还是1， $python实现损失函数绘制损失函数的优化方法_正则化_05$ 对应的正则化项是 $python实现损失函数绘制损失函数的优化方法_算法_09$ ，明显小于1，所以我们可以选出像 $python实现损失函数绘制损失函数的优化方法_正则化_05$ 这样较为平均的权重，而不是像 $python实现损失函数绘制损失函数的优化方法_损失函数_04$ 这样一家独大的权重

python实现损失函数绘制损失函数的优化方法_损失函数_12

可以把上述的 $python实现损失函数绘制损失函数的优化方法_算法_13$ 看做是下图中的 $python实现损失函数绘制损失函数的优化方法_算法_14$ ，把上述的 $python实现损失函数绘制损失函数的优化方法_损失函数_15$ 看做是下图汇总的 $python实现损失函数绘制损失函数的优化方法_算法_16$ ，往往更简单的模型的泛化能力更强（此图也可以帮助理解泛化能力的含义），也可以有效的防止过拟合