梯度下降法的学习效率梯度下降法作用

转载

云端筑梦师 2024-04-22 12:19:48

在机器学习领域，熟练掌握梯度法来求一个目标函数的最优值是非常重要的。

如图，寻找一个theta 使得损失函数J 最小。

梯度下降法的学习效率梯度下降法作用_损失函数

每取一个 theta 值都对应一个 J。

对于导数 dJ / d theta，在直线方程中，导数代表斜率；曲线方程中，导数代表切线斜率；在此图中，导数代表 theta 单位变化时，J相应的变化。

由图右半部分可知，若随着 theta 增大，J 会减小；theta 减小，J 会增大。因此，从某种意义上讲导数可以代表方向，随着 theta 增大，对应 J 增大的方向就可表示为 -n dJ / d theta，即图中蓝点右移，直到 -n dJ / d theta 为 0 。

梯度下降法的学习效率梯度下降法作用_损失函数_02

对于多维函数，这个导数就是梯度。

梯度下降法的学习效率梯度下降法作用_梯度下降法_03

同理，随着 theta 减小，对应 J 减小的方向为 -n dJ / d theta，即图中蓝点左移，直到 -n dJ / d theta 为 0 ，对应的损失函数 J 最小。

其中

对于这个问题，我们的解决方案是：

对于线性回归法的损失函数具有唯一的最优解，线性回归的目标是使

梯度下降法的学习效率梯度下降法作用_最优解_04

尽可能小。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

梯度下降法的学习效率 梯度下降法作用