智能视频分析技术主要包括:运动目标检测、目标跟踪、目标分类、行为理解四种智能视觉分析技术。其中,目标跟踪与目标检测是基础部分,目标分类和行为理解是高级部分。

01

运动目标检测

运动目标检测是智能视频处理技术的基础,是从视频图像中去除掉背景成分,找出运动的物体或区域,在这个过程中尽可能地减少背景噪声和前景噪声的干扰,以便得到我们感兴趣的运动目标。目前运动目标检测方法主要包括时间差分法、光流法和背景差分法等。

02

目标跟踪

运动目标跟踪是指在视频序列中的每帧图像中确定我们感兴趣的运动目标的位置,并获得该运动目标的其它一些运动参数(如运动目标的速度、加速度、方向等)和运动轨迹。目前进行运动目标跟踪主要有确定性的方法和基于统计理论的跟踪方法两类。确定性的方法是将遇到跟踪问题转换成一个最优化问题来求解,例如求解代价函数的极值,这种方法里面最具代表性的是均值漂移(Mean shift)算法。基于统计理论的跟踪方法是将跟踪问题转换为状态估计问题来求解,目的是求解状态的最优估计,最具代表性的算法有卡尔曼滤波器(Kalman filter, KF)、采样卡尔曼滤波器(Unscented Kalman filter, UKF)、扩展 Kalman 滤波器(Extended Kalman filter, EKF)、粒子滤波器(Particle filter, PF)等。

03

目标分类

目标分类的目的是从检测到的运动区域中将特定类型物体的运动区域提取出来,如分类场景中的人、车辆等不同目标。根据可利用信息的不同,目标分类可以分为基于运动特性的分类和基于形状信息的分类两种方法。基于运动特性的识别利用目标运动的周期性进行识别,受颜色、光照的影响较小。基于形状信息的识别利用检测出的运动区域的形状特征与模板或者统计量进行匹配。

04

行为理解

目标的行为理解是指对目标的运动模式进行分析和识别。行为理解可以简单地被认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过在跟踪过程中检测目标的行为以及行为变化,根据用户的自定义行为规则,判断被跟踪目标的行为是否存在威胁。


作者:李莉   李胜广