视频分析(video analyzing)是用计算机从视频中通过运算和分析,提取视频中有用信息的一项技术。对计算机来说,视频图像只是一个数据数列,一个包含每一帧每一个像素点的灰度值或彩色值的数列,其目标信息包含在那些像素点的值所组成的平面图像序列中,是需要从“整体”上进行“理解”才能获得的。而视频分析技术便是通过特定的核心算法程序提取视频信号中所包含的内容信息或个体运动信息,以实现计算机对于视频的理解—— “明白”视频中所展现的内容或者发生的的事情,即“事件”。

  视频分析技术范围很广,只要是从视频中通过运算处理,提取有用信息的方式都可称作视频分析技术。目前发展相对成熟并形成产品投入实际项目应用的技术,如车牌识别技术、视频检索技术、视频人脸检测等,皆可归为“视频分析技术”。严格来讲,这类技术原本只是视频分析技术中较为粗浅的一部分,不过由于它们已被较好地挖掘和应用,出现一些专门的称谓,才被单独提了出来。当前,通常所说的视频分析技术一般特指从视频中目标运动行为的分析、提取和识别,它常用于安防监控领域,其所指称的范围比之字面含义已有大幅缩小。

  视频分析技术运作流程是:首先使得计算机知道视频中“发生的是什么事”,再将其与对应的规则相比对和判断,由此计算机即可断定事件的特性。从视频中个体运动行为的分析、提取和识别角度来看,即令计算机判断出这些个体进行了一些什么行为,进而能够判断这些行为是否符合某些规则,是否属于“某一类型”的行为。一旦出现的行为或事件不符合相应的规则,即刻发出告警信息,从而摆脱人工的干预和判断,实现令计算机“代替”人进行监控,也即实现了自动监控或“智能监控”。

  实际上,智能视频分析技术,起源于计算机视觉技术。计算机视觉(ComputerVision)技术,是人工智能(ArtificialIntelligent)研究的分支之一,它能够在图像及图像描述之间建立映射关系,从而能够通过数字图像处理和分析来理解视频画面中的内容。计算机视觉技术可分为低层视觉技术(Low-level Vision)与高层视觉技术(High-level Vision)。低层视觉技术要解决特征提取、运动检测、多目标根踪等基本问题;高层视觉技术要解决对场景的语义理解,如目标运动轨迹的判别,异常行为异常事件的最终结论等。因此,在计算机视觉领域中,一个最根本的问题就是如何从底层原始视频数据得到高层的语义理解,而智能视频监控技术中的智能视频分析技术的研究正是紧紧围绕这个基本问题,其研究范围不是仅局限于某个特定问题,而是涉及到计算机视觉中从底层到高层的许多基本问题。

  智能视频监控技术主要是对视频自动进行分析,从视频中提取关键信息,发现与识别异常的感兴趣事件,从而可以替代人为监控或者协助人为监控。显然,视频分析与识别涉及到复杂的软件算法,它可以通过编程识别出奇怪与异常的行为。视频内容分析与识别软件能通过分析现场或记录的视频流,检测识别出可疑的活动、事件或者行为模式。视频监控系统的智能化是指在不需要人为干预的情况下,系统能自动实现对监控画面中的异常情况进行检测、识别,并及时作出预/报警。

  视频分析技术通常采用背景减除技术来进行图像变化的检测(如入侵、丢包、逆行等都是一种模式的图像变化),即对视频帧与基准背景图像进行比较,相同位置的像素(区域)变化则认为是变化了的区域,对这些区域进一步处理、识别、跟踪,得到包括目标位置、尺寸、形状、速度、停留时间等基本形态信息和动态信息,完成目标的跟踪和行为理解之后,也就完成了图像与图像描述之间的映射关系,从而使系统进一步进行规则判定,直到触发报警。

  目前,普遍使用的运动目标检测方法就是背景减除法,其算法虽较简单,但仍然会受到光线、天气等自然条件及背景自身变化(海浪、云影、树叶摇动等情况)的影响。针对不同的天气以及自然干扰,已应用有多种附加算法(过滤器)来弥补这些干扰。随着光电图像处理技木及微电子技术的发展,相信智能视频分析技术会进一步成熟。

  从广义上来说,也可以把智能视频分析技术分为如下三类。

  视频分析类

  该类主要是在监控图像中找出目标,并检测目标的运动特征属性。如目标相对的像素点位置,目标的移动方向及相对像素点移动速度,目标本身在画面中的形状及其改变。根据以上的基本功能,视频分析可分为以下几个功能模块。

  · 周界入侵检测、目标移动方向检测;

  · 目标运动、停止状态改变检测;

  · 目标出现与消失检测;

  · 人流量、车流量统计;

  · PTZ自动追踪系统;

  · 系统智能自检功能等。

  视频识别类

  该类包括人脸识别、步态识别与车牌识别,其主要技术是在视频图像中找出局部中一些画面的共性。如人脸必然有两个眼睛,如果可以找到双目的位置,那么就可以定性人脸的位置及尺寸(在现有技术条件下,人脸识别系统必须在双目可视的情况下,才可进行人脸比对)。视频识别类其主要包括。

  · 人脸识别系统;

  · 步态识别系统;

  · 车牌识别系统;

  · 照片比对系统;

  · 工业自动化上的零件识别即机器视觉系统等。

  视频改善类

  该类主要是针对一些不可视、模糊不清,或者是对振动的图像进行部分优化处理,以增加视频的可监控性能。具体包括。

  · 红外夜视图像增强处理;

  · 车牌识别影像消模糊处理;

  · 光变与阴影抑制处理;

  · 潮汐与物体尺寸过滤处理;

  · 视频图像稳定系统等。