这篇文章由已有的三篇文章加自己的理解构成。
理论基础
分水岭算法主要用于图像分段,通常是把一副彩色图像灰度化,然后再求梯度图,最后在梯度图的基础上进行分水岭算法,求得分段图像的边缘线。对灰度图的地形学解释,我们我们考虑三类点:
1. 局部最小值点,该点对应一个盆地的最低点,当我们在盆地里滴一滴水的时候,由于重力作用,水最终会汇聚到该点。注意:可能存在一个最小值面,该平面内的都是最小值点。
2. 盆地的其它位置点,该位置滴的水滴会汇聚到局部最小点。
3. 盆地的边缘点,是该盆地和其它盆地交接点,在该点滴一滴水,会等概率的流向任何一个盆地。
假设我们在盆地的最小值点,打一个洞,然后往盆地里面注水,并阻止两个盆地的水汇集,我们会在两个盆地的水汇集的时刻,在交接的边缘线上(也即分水岭线),建一个坝,来阻止两个盆地的水汇集成一片水域。这样图像就被分成2个像素集,一个是注水盆地像素集,一个是分水岭线像素集。
在真实图像中,由于噪声点或者其它干扰因素的存在,使用分水岭算法常常存在过度分割的现象,这是因为很多很小的局部极值点的存在,比如下面的图像,这样的分割效果是毫无用处的。为了解决过度分割的问题,可以使用基于标记(mark)图像的分水岭算法,就是通过先验知识,来指导分水岭算法,以便获得更好的图像分段效果。通常的mark图像,都是在某个区域定义了一些灰度层级,在这个区域的洪水淹没过程中,水平面都是从定义的高度开始的,这样可以避免一些很小的噪声极值区域的分割。
简单代码应用
现在我们看看OpenCV中如何使用分水岭算法。首先打开一幅图。接下来,我们要创建mark图像。mark图像格式是有符号整数,其中没有被mark的部分用0表示,其它不同区域的mark标记,我们用非零值表示,通常为1-255,但也可以为其它值,比如大于255的值,不同mark区域甚至可以用同样的值,这个值大小对最后分割可能没有影响(也可能影响),最好不同mark区域还是用不同的值表示,这样能够确保结果正确,之所以用有符号整数,是因为opencv在分水岭算法内部,要用-1,-2等来标记注水区域,最终在mark图像中生成的分水岭线就是用-1表示。
我们通常会创建uchar格式的灰度图,指定mark区域,然后转化为有符号整数的图像格式。
首先对整个背景区域我们创建一个mark域,是下图中白色框框住的部分,其灰度值为255,第二个选择mark域为塔,就是黑色框框住的一块区域,其灰度值为1,最后就是树mark域,蓝色框的部分,其灰度值为128。在分水岭算法时候,会分别对这个3个区域来进行注水操作,如果两个注水盆地被一个mark域覆盖,则它们之间不会有分水岭线产生。
对于mark图像,opencv分水岭算法在初始化时候,会把最外圈的值置为-1,作为整个图像的边界,所以我们第一个mark区域,选择倒数第2外圈,因为设置到最外圈,最后还是会被冲掉。
// 标示背景图像
cv::Mat imageMask(image.size(),CV_8U,cv::Scalar(0));cv::rectangle(imageMask,cv::Point(1,1),cv::Point(image.cols-2,image.rows-2),cv::Scalar(255),1);
// 表示塔
cv::rectangle(imageMask,cv::Point(image.cols/2-10,image.rows/2-10),
cv::Point(image.cols/2+10,image.rows/2+10),cv::Scalar(64),10);
//树
cv::rectangle(imageMask,cv::Point(64,284),
cv::Point(68,300),cv::Scalar(128),5);
注意:mark图像是32bit的有符号整数,所以在使用分水岭算法前,我们先对mark图像做一个转化。算法执行完后,再转化为0-255的灰度图。
imageMask.convertTo(imageMask,CV_32S);
// 设置marker和处理图像
cv::watershed(image,imageMask); cv::Mat mark1;
imageMask.convertTo(mark1,CV_8U);
cv::namedWindow("marker"); cv::imshow("marker",mark1);
注:在转化前分水岭线的值为-1,转化后成为0。
我们使用一个转化函数把分水岭线转化为黑色,其它的部分都白黑色,转化函数的公式为:
imageMask(x,y) = saturate_cast<uchar>(255*imageMask(x,y)+255)
注:在转化前,分水岭线的值为-1)
OpenCV中分水岭算法的原理
我们来学习一下opencv中分水岭算法的具体实现方式。
原始图像和Mark图像,它们的大小都是32*32,分水岭算法的结果是得到两个连通域的轮廓图。
原始img图像:(原始图像必须是3通道图像)
mark图像:
结果mark图像:
初始的mark图像数据如下,黄色的部分为我们的第一个mark区域,值为255,第二个区域为褐红色的区域,值为128,第三个绿色的区域,值为64。
opencv分水岭算法描述如下:
初始化mark矩阵,生成最初的注水区域。
1. 设置mark图像的边框值为-1
2. 标记每个mark区域的边界为-2
3. 对于mark图像一个像素值,如果它本身值为0,但上下左右四邻域有一个像素值大于0,则把img图像中该点按照RGB高度值(实际上是梯度值)放入优先队列q的对应位置。
其中q是这样的一个数据结构:它是一个0到255的数组,每个元素分别是一个队列的头。当往q的同一个位置添加高度值时,就是找到它的位置,再往对应队列的后面添加元素。
举例说明:如下图像素点,它的mark值为0,但左和上像素值不为0,此时,我们求原始图像中对应像素的高度值,高度值的计算方式如下面公式,其中R表示Red通道值,G表示Green通道值,B表示Blue通道值,下标L表示左,R表示右,T表示上,B表示下,abs表示取绝对值,min和max分别为最小值和最大值函数:
min(max(abs(R-RL), abs(G-GL), abs(B-BL)),max(abs(R-RT), abs(G-GT), abs(B-BT)),max(abs(R-RR), abs(G-GR), abs(B-BR)),max(abs(R-RB), abs(G-GB), abs(B-BB)))
上图中指定的像素,它的高度值显然为0,所以我们把(2,2)点放入优先队列q的0位置。
初始化阶段完成后,我们得到下面的mark图,并把-2对应的边界像素点,按照其对应的RGB高度值放入队列q。
之后就进入了递归注水过程,递归过程描述如下:
for(; ; )
{
从0开始扫描优先队列q,如果找到一个像素标记,则弹出该标记。
如果mask图像中该像素的四邻域中存在两个不同的非0值,表示该点为两个注水盆地的边缘,即分水岭线,在mark图像中标记该点为-1;否则在mask图像中标记该点为四邻域中大于0的那个值(如果有多个大于0的值,则按照左右上下的顺序取)。
扫描mark图像中该点的四邻域,是否存在为0的mark域,存在的话这把该邻域点按照rgb高度值,放入相应的队列。
}
经过上述的递归过程,最后我们得到的mark图像如下所示,其中绿色格子的-1即为所有的分水岭边界:
void WatershedGray(cv::Mat &src, cv::Mat &dst);该函数演示灰度图的分水岭算法。