原标题:方向导数和梯度是什么?

为什么梯度的方向是函数在该点的方向导数最大的方向,梯度的模是最大方向导数的值?大家在看复习全书时,有认真想过这个问题吗?小编在本文以二元函数为例详细讲解方向导数和梯度,并试图以尽可能通俗地语言回答上述问题。

1.梯度

首先看看二元函数梯度的定义:

如果函数f(x,y)在定义域D内具有一阶连续偏导数,则对于定义域内D每一点P(x0, y0),都存在如下向量:

二元函数用梯度下降法求最小值_定义域

则称上述向量为函数f(x,y)在点P的梯度,记作:

二元函数用梯度下降法求最小值_二元函数用梯度下降法求最小值_02

而下面的算子称为向量微分算子或哈密顿算子(nabla算子):

二元函数用梯度下降法求最小值_斜率_03

至于为什么在梯度定义中,要附加强要求,即函数f(x, y)在定义域内具有一阶连续偏导数,说实话,小编也没搞清楚。有人说具有一阶连续偏导,则必然可微,然后可以将梯度和方向导数联系起来,这说法有一定道理,但是可微与一阶连续偏导并不是等价的。尽管学习时有些知识点不甚理解,但是切记一定要以定义为准,科学家之所以这么定义,必然有其实际和理论上的考虑。

接下来,仔细看看梯度。函数f(x,y)在点P的梯度是向量,向量是有大小和方向的,那函数在P点梯度的方向和大小是?

这就涉及到向量的加法了,请看下图。下图标红色的部分用向量l表示,向量l的方向就是梯度的方向,向量l的模就是梯度的大小。

二元函数用梯度下降法求最小值_斜率_04

图1. 梯度示意图

2.方向导数

在讨论方向导数前,大家还记得导数、偏导数的几何意义吗?在一元函数中,某一点的导数就是曲线在该点的切线的斜率,也就是反映函数在该点的变化率。在二元函数中,偏导数反映的是函数沿x轴方向或y轴方向的变化率。而方向导数描述的是函数沿某一方向的变化率,在二元函数中,除了坐标轴两个方向外,还存在其它无数个方向,因此,方向导数用于研究函数沿各个不同方向时函数的变化率。

同偏导数定义类似,请看看下面这种方向导数的定义:

二元函数用梯度下降法求最小值_斜率_05

结合下面这道例题来帮助大家理解方向导数的定义:

二元函数用梯度下降法求最小值_定义域_06

首先要确定直线l的方向,看下图:

二元函数用梯度下降法求最小值_定义类_07

图2. 方向导数中直线l的方向示意图

在图2中α、β分别为直线l与x轴正方向、y轴正方向的夹角。α、β共同表示直线l的方向。由图2,不难得出如下关系式:

二元函数用梯度下降法求最小值_函数的梯度方向和切线方向_08

现在假设在直线l上的点P,沿着直线l正方向即箭头方向前进一个单位长度1,对应于在横轴上移动cosα,在纵轴上移动cosβ。也就是说,当从p点沿直线正方向移动距离t时,二元函数自变量x变动tcosα,自变量y变动tcosβ,此时方向导数定义将变为如下形式:

二元函数用梯度下降法求最小值_斜率_09

按照上述定义,将函数z的相关数据带入进去,得:

二元函数用梯度下降法求最小值_定义类_10

现在看看方向导数与偏导数的关系。若函数f(x, y)在点P(x0, y0)可微,有:

二元函数用梯度下降法求最小值_定义域_11

至于如何证明上式,只要大家结合前面两个关于方向导数的定义,不难证明,你试试吧!

3.方向导数与梯度的关系

为方便理解,不妨把方向导数与梯度的条件和关系式放到:

方向导数是标量,只有大小,没有方向。当函数f(x, y)在点P(x0, y0)可微时,存在如下关系式:

二元函数用梯度下降法求最小值_二元函数用梯度下降法求最小值_12

梯度是矢量,既有大小,又有方向,且梯度前提是函数f(x, y)具有连续一阶可偏导:

二元函数用梯度下降法求最小值_函数的梯度方向和切线方向_13

从方向导数和梯度的定义看,给定曲线上一点,梯度也随之确定,但是方向导数还没确定,所以可以从方向导数推向梯度。

可能你认为当cosα=cosβ=1,方向导数最大,但是你忽略了可行性的问题,因为没有哪条直线能够既与x轴重合,由于y轴重合。事实上α与β存在如下关系:

二元函数用梯度下降法求最小值_定义域_14

将上式带入方向导数定义中,可得:

二元函数用梯度下降法求最小值_二元函数用梯度下降法求最小值_15

从上式,可以轻松得到如下结论:

方向导数最大的方向,为梯度方向,最大方向导数是梯度的模。

方向导数最小的方向,为梯度方向的反方向,最小方向导数是梯度的模的相反数。