0 引言

前面的文章介绍过一元函数的极值问题—— 一元函数极值问题 这篇文章来讲讲多元函数的极值问题,其实很多逻辑可以和一元函数的极值问题联系。

1 极值(局部极值)

设f(X)为定义在n维欧式空间的某一区域R上的n元实函数,其中X=n元函数的极值_海塞矩阵。对于n元函数的极值_地理位置_02,如果存在某个n元函数的极值_优化_03,使得X∈R且n元函数的极值_海塞矩阵_04X均满足:
n元函数的极值_极值_05则称n元函数的极值_海塞矩阵_06为f(X)在R上的局部(相对)极小点,n元函数的极值_海塞矩阵_07为局部极小值。

上面的定义看似很复杂晦涩,其实想表达的意思很简单,原理和一元函数的极值是一样的。

“对于n元函数的极值_地理位置_02,如果存在某个ε>0,使得n元函数的极值_极值_09n元函数的极值_海塞矩阵_04X”其实意思是“n元函数的极值_地理位置_02,如果存在某个ε>0,使得所有与n元函数的极值_海塞矩阵_06的距离小于ε的X均满足n元函数的极值_地理位置_13”,再直白一点就是,在以n元函数的极值_海塞矩阵_06为中心,且与n元函数的极值_海塞矩阵_06的距离为ε的局部区域中,n元函数的极值_海塞矩阵_06对应的函数值n元函数的极值_海塞矩阵_07均满足n元函数的极值_地理位置_13,则n元函数的极值_海塞矩阵_06就是局部最小点,n元函数的极值_海塞矩阵_07就是局部极小值。

可以想象一下在一片群山中,某处山谷是附近的最低点,那么山谷对应的地理位置就是局部最小点,山谷的海拔或者说高度就是局部最小值。

n元函数的极值_优化_21


但是大家再仔细思考一下,如果这个山谷中,有一块水平的平地,且最低点就在这里面,也就是说这块平地所有点其实都是最低点,那说明这个局部极小点n元函数的极值_海塞矩阵_06并不唯一,n元函数的极值_海塞矩阵_06所对应的位置并不是严格的局部极小点(因为这块平地的点都是极小点),所以我们就引出另一个定义:严格局部极小点。

若对于所有n元函数的极值_海塞矩阵_24且与n元函数的极值_海塞矩阵_06的距离小于ε的X∈R,有
n元函数的极值_极值_26则称n元函数的极值_海塞矩阵_06为f(X)在R上的严格局部极小点,n元函数的极值_海塞矩阵_07为严格局部极小值。
这个理解与上面相似,在一片区域内,所有的点对应的函数值都比n元函数的极值_海塞矩阵_06处对应的函数值n元函数的极值_海塞矩阵_07大,注意不存在等于的情况,必须都大,那么n元函数的极值_海塞矩阵_06就是严格局部极小点

通过观察比较,可以发现上下的定义区别在与不等式中的不等号是否带等号,局部(相对)极小点为n元函数的极值_地理位置_13,严格局部极小点为n元函数的极值_地理位置_33。所以,结合上面的解释以及定义的比较,就能够比较清楚地理解两者的区别了。

2 最值(全局极值)

在一元中,除了介绍极值点,还介绍了最值点,注意!最值点的英文表达是global maximum、global minimum,global 指的就是全局而不是局部了。所以接下来我们介绍一下全局极小值、严格全局极小值!

若点n元函数的极值_地理位置_02,对于所有X∈R均满足:
n元函数的极值_极值_05则称n元函数的极值_海塞矩阵_06为f(X)在R上的全局极小点,n元函数的极值_海塞矩阵_07为全局极小值。
同理有,若对于所有n元函数的极值_海塞矩阵_24n元函数的极值_极值_09,都有
n元函数的极值_极值_26则称n元函数的极值_海塞矩阵_06为f(X)在R上的严格全局极小点,n元函数的极值_海塞矩阵_07为严格全局极小值。
当然,若将上述不等式反向,即可得到相应的极大点以及极大值点的定义!

3 极值存在条件

同一元函数的极值一样,我们接下来介绍一下n元函数极值点存在的条件,主要分为必要条件、充分条件。
先介绍一个概念:梯度梯度是一个向量,表示函数在某一点上的变化率。梯度在一元函数中表示为斜率(y对x求导),而对于多元函数,梯度可以用偏导数来计算。
n元函数的极值_海塞矩阵_43为定义在n维欧式空间的某一区域R上的n元实函数,其中n元函数的极值_优化_44,其梯度记为n元函数的极值_海塞矩阵_45,则梯度的计算公式为
n元函数的极值_极值_46其中,n元函数的极值_海塞矩阵_47表示函数n元函数的极值_海塞矩阵_43对变量n元函数的极值_地理位置_49的偏导数。梯度简单理解就是对所有变量都求一遍一阶导,再都放在一起组成一个向量。

3.1 必要条件:

R是n维欧式空间上的某一开集(开集与开区间概念相似,即端点或者区域边缘取不到集合),n元函数的极值_海塞矩阵_43R上有一阶连续偏导数即
n元函数的极值_海塞矩阵_51存在。若f(X)且在点n元函数的极值_地理位置_02取得局部极值,则必有
n元函数的极值_多元函数_53
n元函数的极值_极值_54其中n元函数的极值_海塞矩阵_55是函数n元函数的极值_海塞矩阵_43在点n元函数的极值_海塞矩阵_06处的梯度。
这里注意一下为什么要强调“n元函数的极值_海塞矩阵_43R上有一阶连续偏导数”,因为前面其实有提到,驻点(导数为0的点)不一定是极值点(比如n元函数的极值_优化_59),极值点也不一定是驻点(比如n元函数的极值_海塞矩阵_60的角点存在)。而我们假设n元函数的极值_海塞矩阵_43R上有一阶连续偏导数,实际上已经排除了角点的存在。对于平滑的函数,极值仅在一阶导数为零处即驻点处存在。
和一元函数类似,对于多元函数f(X),满足n元函数的极值_优化_62的点,我们也称为驻点或者平稳点,但需要注意的是,在区域内部,极值点必为驻点,但驻点不一定是极值点。

以上多元函数极值点存在的必要条件。接下来,再介绍一下多元函数极值点存在的充分条件。

3.2 充分条件:

R是n维欧式空间n元函数的极值_极值_63上的某一开集,n元函数的极值_海塞矩阵_43R上具有二阶连续偏导数,即
n元函数的极值_地理位置_65 存在,其中n元函数的极值_海塞矩阵_66

若对于n元函数的极值_海塞矩阵_43,有n元函数的极值_地理位置_68,并且对于任何非零向量n元函数的极值_多元函数_69,有
n元函数的极值_地理位置_70
n元函数的极值_海塞矩阵_06n元函数的极值_海塞矩阵_43的严格局部极小点。

其中,n元函数的极值_海塞矩阵_73n元函数的极值_海塞矩阵_43n元函数的极值_海塞矩阵_06处的海塞矩阵(Hessian Matrix)
n元函数的极值_多元函数_76实际上,n元函数的极值_地理位置_77表示n元函数的极值_海塞矩阵_43n元函数的极值_海塞矩阵_06处的海塞矩阵n元函数的极值_海塞矩阵_73为正定矩阵。