卡尔曼滤波应用广泛且功能强大,它可以估计信号的过去和当前状态,甚至能估计将来的状态,即使并不知道模型的确切性质。卡尔曼滤波是一种递归的估计,即只要获知上一时刻状态的估计值以及当前状态的观测值就可以计算出当前状态的估计值,因此不需要记录观测或者估计的历史信息。
其基本思想是:以最小均方误差为最佳估计准则,采用信号与噪声的状态空间模型,利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计,求出当前时刻的估计值,算法根据建立的系统方程和观测方程对需要处理的信号做
出满足最小均方误差的估计。
卡尔曼滤波器包括两个主要过程:预估与校正。
预估过程
主要是利用时间更新方程建立对当前状态的先验估计,及时向前推算当前状态变量和误差协方差估计的值,以便为下一个时间状态构造先验估计值;
校正过程
负责反馈,利用测量更新方程在预估过程的先验估计值及当前测量变量的基础上建立起对当前状态的改进的后验估计。
这样的一个过程,我们称之为预估-校正过程,对应的这种估计算法称为预估-校正算法。
卡尔曼滤波器的递归过程:
1) 估计时刻k 的状态:
X(k) = A*X(k-1) + B*u(k)
这里, u(k) 是系统输入
2) 计算误差相关矩阵P, 度量估计值的精确程度:
P(k) = A*P(k-1)*A’+ Q
这里, Q = E{ Wj^2 } 是系统噪声的协方差阵,即系统框图中的Wj的协方差阵, Q 应该是不断变化的,为了简化,当作一个常数矩阵。
3) 计算卡尔曼增益, 以下略去 (k), 即 P = P(k), X = X(k):
K = P *C’ * (C * P * C’ + R) -1
这里 R = E{ Vj^2 }, 是测量噪声的协方差(阵), 即系统框图中的 Vj 的协方差, 为了简化,也当作一个常数矩阵。由于我们的系统一般是单输入单输出,所以 R是一个 1x1的矩阵,即一个常数,上面的公式可以简化为:
K = P *C’ / (C * P * C’ + R)
4) 状态变量反馈的误差量:
e = Z(k) – C*X(k)
这里的 Z(k) 是带噪声的测量量
5) 更新误差相关矩阵P
P = P – K * C * P
6) 更新状态变量:
X =X + K*e = X + K* (Z(k) – C*X(k))
7) 最后的输出:
Y = C*X
基本思想
利用观测数据对状态变量的预测估计进行修正,以得到状态变量的最优估计,即
最优估计=预测估计+修正
(1)算法是递推的,时域内设计滤波器,适用于多维随机过程的估计;
(2)用递推法计算,不需要知道全部过去的值。用状态方程描述状态变量的动态变化规律,因此,信号可以是平稳的,也可以是非平稳的;
(3)误差准则仍为均方误差最小准则。
首先,我们先要引入一个离散控制过程的系统。该系统可用一个线性随机微分方程(Linear Stochastic Difference equation)来描述:
X(k)=A X(k-1)+B U(k)+W(k)
再加上系统的测量值:
Z(k)=H X(k)+V(k)
上两式子中,X(k)是k时刻的系统状态,U(k)是k时刻对系统的控制量。A和B是系统参数,对于多模型系统,他们为矩阵。Z(k)是k时刻的测量值,H是测量系统的参数,对于多测量系统,H为矩阵。W(k)和V(k)分别表示过程和测量的噪声。他们被假设成高斯白噪声(White Gaussian Noise),他们的covariance 分别是Q,R(这里我们假设他们不随系统状态变化而变化)。
对于满足上面的条件(线性随机微分系统,过程和测量都是高斯白噪声),卡尔曼滤波器是最优的信息处理器。下面我们来用他们结合他们的covariances 来估算系统的最优化输出。
首先我们要利用系统的过程模型,来预测下一状态的系统。假设现在的系统状态是k,根据系统的模型,可以基于系统的上一状态而预测出现在状态:
X(k|k-1)=A X(k-1|k-1)+B U(k) ……….. (1)
式(1)中,X(k|k-1)是利用上一状态预测的结果,X(k-1|k-1)是上一状态最优的结果,U(k)为现在状态的控制量,如果没有控制量,它可以为0。
到现在为止,我们的系统结果已经更新了,可是,对应于X(k|k-1)的covariance还没更新。我们用P表covariance:
P(k|k-1)=A P(k-1|k-1) A’+Q ……… (2)
式(2)中,P(k|k-1)是X(k|k-1)对应的covariance,P(k-1|k-1)是X(k-1|k-1)对应的covariance,A’表示A的转置矩阵,Q是系统过程的covariance。式子1,2就是卡尔曼滤波器5个公式当中的前两个,也就是对系统的预测。
现在我们有了现在状态的预测结果,然后我们再收集现在状态的测量值。结合预测值和测量值,我们可以得到现在状态(k)的最优化估算值X(k|k):
X(k|k)= X(k|k-1)+Kg(k) (Z(k)-H X(k|k-1)) ……… (3)
其中Kg为卡尔曼增益(Kalman Gain):
Kg(k)= P(k|k-1) H’ / (H P(k|k-1) H’ + R) ……… (4)
到现在为止,我们已经得到了k状态下最优的估算值X(k|k)。但是为了要另卡尔曼滤波器不断的运行下去直到系统过程结束,我们还要更新k状态下X(k|k)的covariance:
P(k|k)=(I-Kg(k) H)P(k|k-1) ……… (5)
P(k|k)是后验估计误差协方差矩阵,度量估计值的精确程度
其中I 为1的矩阵,对于单模型单测量,I=1。当系统进入k+1状态时,P(k|k)就是式子(2)的P(k-1|k-1)。这样,算法就可以自回归的运算下去。
式子1,2,3,4和5就是卡尔曼滤波器的5个基本公式。
kalman滤波器工作原理用图表示如下
kalman滤波器用于跟踪时用之前观测到的值预测下一步的状态,然后根据观测值对自己作出修正,如此不断迭代,以实现跟踪。
你可能会想,kalman滤波器到底有什么用呢,既然我每次都能观测到测量的状态值,比如速度,那我还要kalman滤波器来预测速度干嘛,而且它得到的的预测值还不一定准?我的理解是你之所以能够观测到状态值,完全是因为kalman滤波器的功劳。假设一个装有kalman滤波器的追踪器(tracker)在跟踪一个目标(target),tracker不知道target下一时刻的速度(包括大小和方向),tracker有的只是前一时刻它观测到的target的速度,现在tracker要决定下一时刻自己要往哪个方向运动,运动多快,一旦决策失误,tracker就会丢失target。那该怎么办呢?这就是kalman滤波器发挥作用的时候了,kalman滤波器根据之前的观测值告诉tracker:往12点钟方向走,速度80迈(当然也可能在三维空间中)。于是tracker按照kalman滤波器告诉它的信息执行跟踪,发现成功跟上target,于是tracker把此时它观测到的target状态反馈给kalman滤波器,以方便kalman滤波器做下一步决策。如果没有kalman滤波器,tracker胡乱走一个方向,很可能会跟踪失败。如果聪明一点的话,tracker按照之前它观测到的target的速度来前进,假设这一刻target突然转向,如果没有kalman滤波器,tracker就会离target越来越远,最终跟丢。有kalman滤波器的话,kalman滤波器会告诉tracker说,嘿,老兄,我们该转方向了。你可能会问target转向特别迅速怎么办?那就提高kalman滤波器预测和校正的频率。这样一想,其实kalman滤波器的思想很朴素
图像处理之目标跟踪(一)之卡尔曼kalman滤波跟踪(主要为知识梳理)
卡尔曼滤波--从推导到运用