pytorch 获得前向传播结果 pytorch重写反向传播

转载

墨染青衫 2023-11-21 15:36:38

前向反馈是神经网络用来将输入变成输出的流程。如下图，利用输入向量，对其应用一系列模型和sigmoid函数，这些图组合后成为高级的非线性图

pytorch 获得前向传播结果 pytorch重写反向传播_神经网络

再看一遍这个过程，对输入向量先应用W1，然后进行sigmoid，再应用W2，再进行sigmoid，然后最后W3，sigmoid，就得到了y^，这个过程就是前向反馈

pytorch 获得前向传播结果 pytorch重写反向传播_pytorch 获得前向传播结果_02

和之前一样，神经网络将产生误差函数，最终我们需要最小化该误差函数。

现在，我们准备好训练神经网络了。为此，我们将使用一种方法，叫做反向传播。简而言之，反向传播将包括：

听起来比较复杂，实际上要简单些。

例如图中蓝色的点就是一次前向反馈中的到的点，反向传播就像是问这个点，“你希望我做什么？”点说“我希望这条分界线离我近一点”，表现在权重上就是更新权重，得到w1’ w2’。

pytorch 获得前向传播结果 pytorch重写反向传播_反向传播_03

这个过程就像是从误差之巅下来，每次下来一点就得到一个更好一点的模型。

pytorch 获得前向传播结果 pytorch重写反向传播_反向传播_04

对于更复杂的神经网络来说，这个过程是这样的，输入向量经过两个模型的预测（这部分参考前面的【Pytorch】5. 神经网络结构），然后结合之后预测为蓝色的点，但是这个预测结果并不好，我们希望这条线能更往点那边靠靠，可以看到上面哪个模型的预测效果并不好，我们要做的就是减小来自上面这个模型的权重

pytorch 获得前向传播结果 pytorch重写反向传播_反向传播_05

对于一个多层感知机，也就是神经网络来说，它的反向传播的梯度如下

pytorch 获得前向传播结果 pytorch重写反向传播_反向传播_06

链式法则就是用于复合函数的求导，它就是一系列倒数的乘积。这个法则的作用就是帮助我们进行反向传播计算梯度。因为前向反馈就是多种函数的复合，反向传播就是计算出每一步的导数，也就是把每一层的偏导数求出来，然后相乘就可以了

pytorch 获得前向传播结果 pytorch重写反向传播_pytorch 获得前向传播结果_07

再重复一下，前向反馈的过程：

pytorch 获得前向传播结果 pytorch重写反向传播_神经网络_08

反向传播就是计算出误差函数对于每个权重的导数，试着计算一下W11的偏导，如图：

pytorch 获得前向传播结果 pytorch重写反向传播_权重_09

然后顺便提一下，sigmoid 函数有一个完美的导数，我们可以在下面的计算中看到。这将使我们的反向传播步骤更加简洁。

pytorch 获得前向传播结果 pytorch重写反向传播_神经网络_10

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客