泰勒公式得名于英国数学家鲁克·泰勒,可以大致描述为:如果函数足够平滑,并且在已知函数在某一点的各阶导数值的情况下,函数在一个点的邻域内的值可以用函数在该点的值及各阶导数值组成的无穷级数表示出来。如果用一句话描述,就是用多项式去逼近光滑函数。
泰勒公式最直接的应用就是近似计算,一阶泰勒展开式经常应用于机器学习的最优化算法,比如常见的梯度下降法。
泰勒公式的定义
在包含的区间[a,b]上具有n阶导数,并且在开区间(a,b)上n+1次可导,那么对于闭区间[a,b]上的任意x都有:其中,表示的n阶导数。等号后的多项式称为函数在处的泰勒展开式,剩余的叫做泰勒公式的余项,是的高阶无穷小。
常见的泰勒公式余项是拉格朗日余项,公式如下:
的话,就是麦克劳林公式,即:
泰勒公式的推导
我们知道,根据拉格朗日中值定理导出的有限增量定理有:
于是:
是在的前提下才趋向于0,所以在近似计算中往往不够精确。于是我们需要一个能够足够精确的且能估计出误差的多项式:
来近似地表示函数且要写出其误差的具体表达式。
首先假设在一点处,和的值是相等的,而且它们的相同阶导数值也是相等的,即函数满足下列等式:
,显然有:
至此,多项式的各项系数都已求出,得:
以上就是函数的泰勒展开式。
接下来就要求误差的具体表达式了,首先,令误差为:
在定义域内n+1阶可导,为的n+1阶无穷小。若,则:
进而:
根据柯西中值定理:
,继续使用柯西中值定理得到:
,继续使用n+1次柯西中值定理得到:
,而,同时:
的n阶导数 = 常数,所以
进而:
综上可得: