ROI区域检测-BMS算法
由于视觉关注机制的驱动,人类视觉系统对图像的不同区域视觉关注程度不同。研究表明,图像的视觉质量主要由感兴趣区域的质量决定。因此,在进行图像或视频编码的过程中,应根据视觉系统对视觉场景中不同区域的感兴趣程度来分配计算资源和编码比特数,准确提取符合人类视觉系统感知结果的视觉显著性区域则是基于感兴趣区域编码的前提。
视觉显著性模型是一种快速提取与场景相关的人眼注意力集中区域的检测模型,现已广泛应用于图像编码、图像分割、物体识别等方面。已有的视觉显著性模型包括基于拓扑结构的显著性模型、利用中心环绕滤波进行显著性检测的模型、基于图像的频谱分析模型、基于机器学习的显著性检测模型等。在上述模型中,BMS(a Boolean Map based Saliency model)模型因具有高精度、低复杂度而成为了目前显著性检测中的典型模型之一。
综合考虑ROI提取的准确度与算法的复杂度,选取了Jianming Zhang等人提出的BMS算法作为感兴趣区域提取的模型。其算法流程如下图所示。
该算法可用下式表示,其中A是平均显著图,B为布尔图,I为输入图像,A(B)表示布尔图对视觉注意力的影响。
BMS算法分为布尔图的计算和显著图的计算两大部分来实现,具体实现过程如下:
1)布尔图计算
BMS根据特征通道的先验分布和所给阈值对输入图像的特征图进行二值化处理,从而得到一组采样后的布尔图。
其中Bi表示采样后的布尔图,Q(I)表示输入图像的特征图,其像素值在0到255之间。FQ表示特征通道采样的先验分布函数,FOQ表示在特征通道上阈值采样的先验分布函数。
2)显著图计算
给定布尔图B,BMS首先激活B中被包围的区域得到激活图M(B),然后归一化M(B)进一步强调稀疏的活跃区,从而得到注意力图,将所有的特征图对应的注意力图叠加,然后再通过膨胀、滤波等处理就得到了显著图。下面是详细过程:
在布尔图B中,像素被分为两个互补的集合:白集C+ : B(i)=1,黑集:C- : B(i)=0。其中i表示像素索引,B(i)表示像素i在B上的布尔值。直观上,如果白色(黑色)像素被黑色(白色)组包围,则称像素被包围。未被包围的像素可以使用以所有图像边界像素作为种子的漫水填充算法有效地屏蔽掉。所得到的激活图M(B)中所有被包围的像素,像素值为1,其余的为0。
在BMS中,首先将激活图M(B)分成两个子激活图:
其中_B表示布尔图的反转。^表示像素方式的布尔连接操作。M+(B)和M-(B)分别表示B和_B上的选定的被包围区域。
经过上述步骤之后,BMS使用膨胀算法扩大选定的激活区域,具体计算如下式所示,其中 KW 是宽度为w的膨胀运算的卷积核。最后,使用L2范数归一化得到注意力图。
注意力图的计算流程如图所示:
将所有的注意力图相加得到平均注意力图,然后通过膨胀、滤波等操作就得到最终的显著图。