作者 | Harper
审核 | gongyouliu
编辑 | auroral-L
隐藏层到底发生了什么
上期给大家介绍了一个人工神经网络实例,并且从中我们了解到,机器是在隐藏层中执行中间的大部分工作的。那么本期内容就来给大家讲一讲,在隐藏层中到底发生了什么。
还是用上期中的例子,在输入层,每个神经元都有一个介于0和1之间的数字,代表了它的灰度值。当你将一张照片输入到人工神经网络中时,照片上的灰度值被转换成从输入层传递到第一个隐藏层的值。每个输入神经元连接到第一个隐藏层中的每个神经元,在识别小狗品种的人工神经网络中,输入层包含625个神经元,对应于图像中的625个像素。每个隐藏层有20个神经元,输入层中的625个神经元中的每一个连接到第一个隐藏层中的20个神经元中的每一个。就意味着一共有12500个链接将输入层链接到第一个隐藏层。这12500个链接是非常重要的,因为每个链接都可以往上或往下调节,会使得链接变得变强或者更弱。比如说,我们输入图像的边缘附近像素的神经元可能不是小狗的一部分,而是背景,所以这部分的神经元就可能与用于分辨背景的神经元有很强的连接,而与其他19个神经元的联系非常弱。那这剩下的19个神经元可能各有各的功能,可能有的负责识别眼睛,有的识别耳朵,有的识别形状,有的识别毛发长短等等。第一个隐藏层中的每个神经元都可以调节与它连接的625个输入神经元的连接强度,进而聚焦在它要识别的特征上。
然后第一个隐藏层中的每一个神经元连接到第二个隐藏层中的20个神经元,创建另外的400个连接。第二个隐藏层的神经元可能试图将第一层中发现的模式与10个不同的小狗品种特征联系起来。
第二个隐藏层中的20个神经元中的每一个都连接到输出层中的10个神经元,形成另外200个连接。在这里,输出神经元可以观察全部特征,并确定图像是某一犬种的可能性。比如,他可能得出这样的结论:这张图片80%的可能性是杜宾犬,15%的可能性是德国牧羊犬,5%的可能性是达克斯猎犬。
当然,这个例子还是比较简单的,但是它还是给我们传达了人工神经网络运作的一般原理。我们需要记住的关键点是,人工神经网络包含的连接远多于他们包含的神经元,正是通过调整这些连接的权重和每个神经元内的偏置项,人工神经网络才能够学习并提高其分类或预测能力。