pytorch正则项 pytorch加入l2正则化

转载

人类新新 2023-10-21 22:12:53

文章标签 pytorch正则项吴恩达深度学习作业吴恩达深度学习编程作业 文章分类 PyTorch 人工智能

推荐守门员应该将球踢到哪个位置，才能让自己的队员用头击中。

1.无正则化模型

pytorch正则项 pytorch加入l2正则化_pytorch正则项

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习编程作业_02

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习作业_03

判别是否有正则化与调用其他计算函数。

准确率：0.948/0.915

pytorch正则项 pytorch加入l2正则化_pytorch正则项_04

明显过拟合overfiting了。

2.L2正则化

公式如下，在原有cost函数基础上增加L2项，L2为参数w的均方根

pytorch正则项 pytorch加入l2正则化_pytorch正则项_05

根据公式书写代码：

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习编程作业_06

增加正则项后，反向传播的导数也会对应改变，其余参数不变。

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习编程作业_07

准确率：0.938/0.93，相比没有正则化变好了一些，并且过拟合现象消失。

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习作业_08

增加超参数

，越大越平滑。

L2正则认为权重越小的函数越简单，越平滑，因此在cost成本函数中增加L2项。

需要改的只有成本函数与反向传播的导数计算公式。

3.Dropout

在深度网络中，每次迭代都以1-keep_prob的概率关闭一些神经元。keep_prob保留神经元的概率。Dropout每次迭代关闭的神经元都不同，因此每次训练的模型其实是不同的，这相当于是另一种神经网络的集成。

步骤：

(1)建立随机数矩阵D，其维度和A输出一样。

(2)将随机数矩阵转化为0,1矩阵，随机数大于keep_prob转换为0，小于keep_prob转换为1。

(3)让矩阵D与矩阵A相乘(对应位置相乘而不是矩阵相乘)，得到新的矩阵A，相乘后为0的那些神经元被关闭。

(4)新的矩阵A除以keep_prob，为了使期望值不变。

前向传播+dropout，记得最后计算得到的A要除以keep_prob哦！

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习作业_09

反向传播+dropout

反向传播时，对A求导数dA需要乘上同一层的D，在得到新的dA后，还需要除以keep_prob。

pytorch正则项 pytorch加入l2正则化_吴恩达深度学习编程作业_10

准确率：0.929/0.95，比之前效果更好。

pytorch正则项 pytorch加入l2正则化_pytorch正则项_11

dropout是一种正则化技术；

dropout只在训练时使用，不在测试中使用；

dropout在前向传播与反向传播中均需要参与，切记除以keep_prob；

小结：

正则化帮助处理过拟合问题；

正则化会减小参数，简化模型；

L2、dropout是一种很好的正则化手段。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python selenium 获取元素文字 selenium 获取元素文本内容

下一篇：python 获取阴阳师窗口位置 python获取游戏窗口

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

pytorch正则项 pytorch加入l2正则化

pytorch正则项 pytorch加入l2正则化

51CTO博客