传统视频监控技术只能达到“千里眼”的作用,把远程的目标图像(原始数据)传送到监控中心,由监控人员根据目视到的视频图像对现场情况做出判断。智能化视频监控的目的是将视频原始数据转化为足够量的可供监控人员决策的“有用信息”,让监控人员及时全面地了解所发生的事件:“什么地方”,“什么时间”,“什么人”,“在做什么”。将“原始数据”转化为“有用信息”的技术中,目标检测与跟踪技术的目的是要解决“什么地方”和“什么时间”的问题。 目标识别主要解决“什么人”或“什么东西”的问题。行为模式分析主要解决“在做什么”的问题。


动态视频目标检测技术是智能化视频分析的基础。本文将目前几种常用的动态视频目标检测方法简介如下:
背景减除
背景减除(Background Subtraction)方法是目前运动检测中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动目标的一种技术。它一般能够提供相对来说比较全面的运动目标的特征数据,但对于动态场景的变化,如光线照射情况和外来无关事件的干扰等也特别敏感。
实际上,背景的建模是背景减除方法的技术关键。最简单的背景模型是时间平均图像,即利用同一场景在一个时段的平均图像作为该场景的背景模型。由于该模型是固定的,一旦建立之后,对于该场景图像所发生的任何变化都比较敏感,比如阳光照射方向,影子,树叶随风摇动等。大部分的研究人员目前都致力于开发更加实用的背景模型,以期减少动态场景变化对于运动目标检测效果的影响。
时间差分

时间差分(Temporal Difference 又称相邻帧差)方法充分利用了视频图像的特征,从连续得到的视频流中提取所需要的动态目标信息。在一般情况下采集的视频图像,若仔细对比相邻两帧,可以发现其中大部分的背景像素均保持不变。只有在有前景移动目标的部分相邻帧的像素差异比较大。时间差分方法就是利用相邻帧图像的相减来提取出前景移动目标的信息的。
让我们来考虑安装固定摄像头所获取的视频。我们介绍利用连续的图像序列中两个或三个相邻帧之间的时间差分,并且用阈值来提取出视频图像中的运动目标的方法。我们采用三帧差分的方法,即当某一个像素在连续三帧视频图像上均有相当程度的变化(及大于设定的阈值时),我们便确定该像素属于运动目标。时间差分运动检测方法对于动态环境具有较强的自适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产生空洞现象,只能够检测到目标的边缘。 而且,当运动目标停止运动时,一般时间差分方法便失效。
光流
基于光流方法(Optical Flow)的运动检测采用了运动目标随时间变化的光流特性,如Meyer 等作者通过计算位移向量光流场来初始化基于轮廓的跟踪算法,从而有效地提取和跟踪运动目标。该方法的优点是在所摄场所运动存在的前提下也能检测出独立的运动目标。然而,大多数的光流计算方法相当复杂,且抗噪性能差,如果没有特别的硬件装置则不能被应用于全帧视频流的实时处理。
当然,在运动检测中还有一些其它的方法,如运动向量检测法,它适合于多维变化的环境,能消除背景中的振动像素,使某一方向的运动对象更加突出的显示出来。但是,运动向量检测法也不能精确地分割出对象。
动态视频目标跟踪技术
在传统监控系统中,目标跟踪是由监控人员手工操作来完成。由于所有的目标的运动特性是非线性的,其速度和方向都在随时发生改变。即使目标的速度、方向不变,但它与摄像机的距离也在变化,从而引入很强的非线性因素,因而用人工操作的方法来实现控制非常困难。
智能化视频监控技术提供有效的目标自动跟踪的工具,在用计算机自动处理视频流的过程中,如发现和跟踪感兴趣的目标,就提示监控人员加以关注,并可以控制灵巧快球摄像机,对移动目标实现自动跟踪。下面我们简述典型的目标跟踪算法的几个步骤。
目标运动轨迹假设:轨迹的交合与分离
在目标轨迹跟踪问题中,一般有五种基本情况:
1、有一个运动检测区域存在,但与任何已知目标都不匹配。在这种情况下,我们需为其创立一个新的目标模型,但它的可信度值比较低。
2、有一个已知目标与任何一个运动检测区域都不匹配。在这种情况发生的可能性包括:在该目标已移出图像视场,该目标被其他目标遮挡,或该目标未被检测出来。在这种情况下,该目标的可信度值也比较低。
3、有一个已知目标与一个运动检测区域完全匹配,这是目标轨迹跟踪问题中的一种最好情况。将该目标的运动轨迹模型更新,并增加其可信度。
4、有一个已知目标与多个运动检测区域都匹配。发生这种情况的可能性包括:一个目标分裂成为多个独立目标(例如一辆车里出来多个人,或一个多人组合各奔东西),或者目标检测中的聚类算法未能将同一个目标的像素正确地聚为一个目标。在这种情况下,我们可以根据相关函数的值来选择一个最好的区域作为目标的新位置。
5、多个目标与一个运动检测区域匹配。发生这种情况的可能性包括:两个目标互相遮挡,两个目标交合(例如多个人上了一辆车,或多个人组合成为一个组),或者是由于聚类算法的失误而分类的同一目标的两部分重新归为一个。 在这种情况下,需要对该目标的以前的轨迹做一分析。比如这两个目标以前一段时间内的轨迹重合或很相似,则可以将他们合为一个目标。否则,需要将他们按两个独立目标分别对待。
更新目标轨迹模型
根据目标匹配的情况对目标模型的参数进行更新。更新后的目标位置由相关函数计算到亚像素精度。更新后的速度经一个IIR滤波器得出。
消除误报
任何一个高性能和高可靠性的目标跟踪系统都需要处理误报问题。视频图像中存在的噪声,随风飘动的树叶等等,都会引起目标检测与跟踪系统的误操作。一个较为可行的消除误报的方法是检查其持续性,因为一个持续出现的检测信号要比偶尔出现一次的信号更有可能成为有效的目标;另外一个可以用来消除误报的方法是检查目标的目的性,来回晃动的树叶并不具备目的性,而运动的人或车辆会向一些特定的目标移动。
以上介绍的主要是单路视频图像的目标跟踪问题。在实际监控系统中,往往同一个人或目标出现在多个摄像机的视场里。如何将与此目标相关的各个摄像头采集的视频图像关联起来,根据物体的运动情况,形成其运动轨迹,并自动发送PTZ 控制指令,使摄像机能够自动跟踪物体,尤其在物体超出该摄像机监控范围之后,自动通知物体所在区域的摄像机继续进行追踪。这才能使目标真正获得了跟踪。上面简要地介绍了动态视频目标检测和跟踪技术的基本问题,作为抛砖引玉。其目的是引起安防技术人员的关注和研究,若有商榷之处,欢迎共同商讨指正。