在该博客中,我们提到了贾佳亚老师团队利用GMM实现颜色迁移的一个工作[1]。后来我详细的学习了该工作,发现还是有很多细节是值得深入研究的。因此,我在学习该工作的基础上,决定撰写这篇博客,分享一些学习心得,以帮助那些希望学习GMM模型的同学深入理解其算法机制。
1. 简介
我们在之前的博客中已经介绍过了一些主流的图像颜色迁移方法。这些方法一般通过计算全局颜色分布对应或者语义分析对应,来构建颜色迁移策略。这带来了一个问题,就是对图像建立一个统一的颜色迁移策略,会降低颜色映射的灵活性,使得结果图缺少色彩的对比度,不能突出一些特定的区域。一个简单的解决方案是首先把图像分成不同的色块或者基于颜色分类的不同区域,然后针对这些区域来建立不同的颜色映射方案。基于GMM模型的图像颜色迁移方法,就是通过GMM来实现图像分割,然后基于分割结果,建立分区域的颜色迁移方案,获得更好的结果。下面,我们来具体介绍下该方法的实现细节。
2. 基于GMM的图像分割
这里的GMM模型是通过期望最大算法(EM)来实现的。简单来说,EM算法就是通过一种迭代计算的方式,将数据按照某一种概率分布的规则,计算出满足要求的最大期望结果。对于图像分割这个具体应用来说,就是建立一种对图像像素的基于概率的分类,使得满足颜色分布的某种最大期望,以获得基于颜色信息的分割结果。
EM算法包含两个基本步骤,即E-step与M-step,分别表示为:
iPxy可以理解为像素点(x,y)属于第i类的概率,通过一个二维的高斯权重函数来计算获得。相关的参数μ和σ的计算依赖于概率 iPxy本身,使得EM实现一个迭代计算的闭环。对于初始化,文献[1] 中提到使用K-means来实现第一轮像素概率预测的赋值。
上述的EM算法只是提供了基础的迭代计算模型,但是对于退出条件以及中间的计算细节没有展开。在原方法中,整个基于EM算法实现的GMM图像分割计算策略包括4步骤; 1) 期望更新;2) 空间平滑;3) 期望最大化;4) 高斯优化。实际上步骤3的期望对大化对应的是EM算法对μ和σ的计算,与上面已经提到的公式一致。步骤 4的高斯优化用于合并一些像素信息十分解决的颜色分类区域,以防止过于细碎的分割,当||μi - μj||<δ时,合并分割i与j。最后当得带不能改变高斯分割结果或改变的量化结果小于某一个特定的极小值时,直接输出。这里我们重点介绍下步骤1和步骤2。(注意,原文的结构,作者是有调整的,有些版本首先介绍了步骤2,这里我们参考的是贾老师在个人网站上上传的版本)
2.1 期望更新
我们假设在分割区域i中,其整个区域类似于一个圆盘,那么这个圆盘的中点极可能属于区域i。如果这个区域被拉长,或者像素正好在这个区域的边缘,那么我们希望该像素对于其属于区域i的概率为非零(我理解的结果是一个极小值),这样保证了边界区域的平滑性。首先我们定义一个新的概率表示,即:
相比于之前我们介绍过的iPxy计算公式,新的概率表示增加了一项P‘,这里可以理解为考虑了上一步对概率平滑的影响。其计算过程将在2.2中介绍。如果我们用P’‘来表示上面公式的后一项,并考察P‘与P’‘的关系,我们就会发现,如果二者有相似的分布,那么对应的像素(x,y)与其邻居具有相似的颜色值,即该点应该不在边界上,从而判断出该点属于高斯分割的一个确定的类中。反之,该点处在一个边界上,使得该点属于多个高斯分割,这时就需要额外的平滑操作以进行进一步处理。2.2步详细的介绍了平滑操作的过程。
2.2 空间平滑
空间平滑定义了平滑操作的具体过程。
N为点(x,y)的邻域,如果邻域的颜色分布与对应点的颜色一致,那么对应的概率iPxy与iPx’y'应该是近似的。基于上述计算,在EM迭代过程中,考虑了像素邻域的概率分布,使得最后的分割效果具有更好的连续性。结合四个步骤,GMM模型能够最终得到一个基于颜色分布的图像分割结果。下图展示一个示例来说明GMM分割计算。
图1. GMM图像分割示意图。
3. 颜色迁移
这里分为两种情况,1)不具有空间对应;2)具有空间对应。
对于第一种情况,假设存在一对高斯分割,Gi与Gj,而在Lab空间的L通道,μi>=μj,那么迁移后的结果需要继承这种关系。在实际执行中,参考图的一块高斯分割映射到原图的一块高斯分割,当他们的L通道值比较接近,并且满足L通道的单调约束。
对于第二种情况,直接使用语义分析建立对应即可。
综合起来,基于高斯分割对应的颜色迁移公式如下:
这个公式在形式上类似于基于高斯分割对应的Lab颜色迁移计算,并考虑了概率分布的影响,使得最后的结果更加平滑。
4. 总结
基于GMM模型的图像分割以及颜色迁移,很好的利用了源图像内颜色分布的连续性,建立了基于颜色的图像语义连续区域。这对于获得精确的图像分割结果,以及基于分割建立局部语义一致的颜色迁移提供了有效的参考。该方法作为2005年提出的方案,我认为还是具有非常不错的参考价值,深入研究我发现其实还有很多细节可以通过目前颜色迁移领域的新的研究进展加以完善,以建立更加精确的结果。
Reference
YW. Tai, J. Jia, CK. Tang. Local color transfer via probabilistic segmentation by expectation-maximization[C]. 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05). IEEE, 2005, 1: 747-754.