- L1损失函数:最小化绝对误差,因此L1损失对异常点有较好的适应更鲁棒,不可导,有多解,解的稳定性不好。
关于L1损失函数的不连续的问题,可以通过平滑L1损失函数代替:
- L2损失函数:最小化平方误差,因此L2损失对异常点敏感,L2损失函数会赋予异常点更大的损失值和梯度,调整网络参数向减小异常点误差的方向更新,因此容易造成训练的不稳定和发散。仅有一解,解的稳定更好。
关于L1损失函数的不连续的问题,可以通过平滑L1损失函数代替:
上一篇:yolo-V2损失函数理解
下一篇:双线性插值
详细介绍损失函数及其应用。
可见,使用 MSE 损失函数,受离群点的影响较大,虽然样本中
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M