一、目标检测
所谓目标检测就是讲图片或视频中的目标与其他不感兴趣的事务进行区分,从而判断目标是否存在
二、目标检测的发展
注:2013年以前的主要是传统的目标检测算法,2013年以后主要是基于深度学习的目标检测算法。
三、传统目标检测算法
1、Viola-Jones分类器算法:
算法要点:
1.1、 使用类Haar输入特征:对矩形图像区域的和或差进行阈值化;
1.2、 积分图像技术加速了矩形图像区域的45度旋转的值的计算,这个图像结构被用来加速类Haar输入特征的计算。
1.3、 使用Adaboost来创建二分类问题(人脸与非人脸)的分类器节点(高通过率,低拒绝率)。
1.4、 把分类器节点组成筛选式级联(在筛选式级联里,一个节点是Adaboost类型的一组分类器)。换句话说:第一组分类器是 最优,能通过包含物体的图像区域,同时允许一些不包含物体的图像通过;第二组分类器次优分类器,也有较低的拒绝 率;以此类推。只要图像通过了整个级联,则认为里面有物体。这保证了级联的运行速度可以很快,因为它一般可以在前 几步就可以拒绝不包含物体的图像区域,而不必走完整个级联
注:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
2、Hog特征提取算法:
算法概括:
2.1、Hog(方向梯度直方图)特征是一种在图像识别中用来进行物体检测的描述子,通过计算和统计图像局部区域的梯度方向直方图来构成特征,Hog特征通常与SVM分类结合使用,主要用于图像识别中,如行人检测。
2.2、算法实现方法:将图像分成若干连通区域(细胞单元),然后采集细胞单元各像素点的梯度或边缘的方向直方图,最后将这些直方图组合起来构成特征描述器。
2.3、算法优点:首先,由于HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性;其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。
3、DPM模型算法:
四、 基于深度神经网络的目标检测与识别
基于深度学习的目标检测算法大致分为四类:
1、基于区域建议的算法 如,R-CNN、 Fast R-CNN、Faster R-CNN等。
2、基于目标回归的检测算法,如YOLO、SSD,retinanet,EfficientDet。
3、基于搜索的目标检测与识别算法, AttentionNet,强化学习。
4、基于Anchor-free的算法,如 CornerNet,CenterNet,FCOS 等。
网络性能比较: