1. 引言
图像在计算机中主要以光栅图(位图)或矢量图的形式存储。位图由像素表示,每个像素都有自己特定的位置和颜色值,而矢量图使用基于数学方程的几何对象来描述图像。相比于位图,矢量图的文件大小只与描述的图形的复杂度有关,占存储空间更小;由于打开过程是软件按图像中存储的算法进行,矢量图在进行图像伸缩时不会失真,易于编辑。这些特性使得矢量图能广泛应用于图像压缩与保真、数据压缩、三维建模等领域。
图像的矢量化方法也引起了学者的广泛讨论和研究。其中的一个方向是,利用多个几何图形的组合来对位图进行拟合。选择怎样的策略优化图形组合成了解决问题的关键。Chris Weller首先提出使用启发式算法来解决这一问题。他将遗传算法中种群的进化与矢量图中图形元素的优化结合,实现了图形元素组合在视觉上逐渐趋近于原图的效果 [1] 。但是该算法生成的矢量图丢失了较多原图的细节。后来相继有学者在他做的工作的基础上进行了改进 [2] [3] ,使矢量图的还原效果有了一定的提高。
Xin-She Yang在2009年提出了一种新型群智能寻优算法——萤火虫算法 [4] ,该算法通过萤火虫之间的亮度交流来寻找最优解,具有快速的全局搜索能力。因此,本文选择萤火虫算法(FA)作为搜索最优图形组合的策略,以图形进化的方式逐步生成矢量图,使矢量图在还原细节、缩小体积等方面有更优的表现。测试对比结果表明本文方法具有一定有效性与可行性。
2. 相关工作
生成与目标光栅图相似的矢量图的主要思路是,将一定数目的基本图形绘制成一幅图像,比较它与原图的相似程度,并以适当的策略不断改变图形位置和形状,逐步提高矢量图对光栅图的还原度,最终形成一幅由基本图形组成的矢量图。如图1所示,左侧为矢量图,右侧展示了组成该图的基本图形。
下面介绍该方法的主要步骤:
1) 设置画布:创建一个尺寸与目标图像相同的画布,取一个颜色作为画布的颜色。
2) 向画布添加基本图形:常见的基本图形包括矩形、三角形等 [4] 。
3) 计算适应度:将基本图形添加到画布上之后,需要评估矢量图的还原效果。通过比较每个基本图形与目标位图对应位置像素的差异,得到生成的矢量图的适应度。适应度越高,矢量图的还原度越好。
4) 图形的移动、变形和变色:为了提升矢量图的还原度,需要对基本图形的位置、形状和颜色等属性进行修改。
综上所述,矢量图生成问题本质上是一个最优化问题,而遗传算法、萤火虫算法等元启发式算法适合于解决此类问题。Chris采用遗传算法解决该问题 [1] ,基本图形信息以基因的形式存储,种群在进化中采取杂交、复制、位突变、交换渲染顺序等操作,以产生还原度更高的个体。
Figure 1. Schematic diagram of vector graph generation method
图1. 矢量图生成方法原理示意图
Chris的算法仍存在一些问题。首先,实验表明其算法存在“早熟”问题,在运行数千代后,算法基本陷入局部最优解,适应度难以继续提升,最终对目标图像的还原度不高。这主要是由于图形数量太多,导致搜索空间过大,而遗传算法难以探索如此大的搜索空间。其次,矢量图由大量的基本图形组成,每次计算目标函数都需要渲染全部图形,对性能的消耗很大,算法运行的效率很低。最后,Chris的算法采用纯色三角形作为基本图形,单个图形中含有的信息较少,不利于进一步压缩体积,且对光滑边缘和柔和色彩的还原能力较差。
为了解决这些问题,本文在以下方面做出改进:
首先,以萤火虫算法进行优化,尝试利用萤火虫只在其感知范围内相互吸引的特点,避免“超级个体”带来的早熟收敛,增大探索范围。其次,利用贪心策略划分子问题,缩小搜索空间,同时减少一次迭代计算的图形个数,提升算法效率。最后,重新设计合适的基本图形,该基本图形由4个顶点组成,由折线或曲线围成,并由渐变颜色填充,如图2所示。这种设计使得图形相比单色图形包含的信息更多,有利于减少图形数量,压缩体积,并且曲线围成的图形对图像中光滑边缘和柔和色彩的还原能力更强。
Figure 2. The basic graphics of vector graph generation process
图2. 基本图形
3. 基于萤火虫算法的矢量图生成方法
3.1. 萤火虫算法的仿生原理 [5]
萤火虫算法由自然界中萤火虫发光的一系列特性发展而来。该算法主要利用萤火虫在某个区域内寻找荧光亮度更强的伙伴并向其聚拢的行为特点,实现基于群体搜索的随机寻优。
为了提取与算法相关的生物学概念,首先说明三个理想化条件:
1) 不考虑性别对于萤火虫吸引力的影响。
2) 萤火虫的吸引力与自身亮度成正比,与萤火虫之间的距离成反比。亮度最高的萤火虫最具有吸引力,使得在一定距离范围内的萤火虫向它移动。亮度相同时,萤火虫随机移动。
3) 萤火虫的荧光亮度反映一个解对待优化问题的满足程度。萤火虫亮度越高,说明萤火虫所在位置对目标的满足值越高。
萤火虫算法将解决问题的各个要素与自然界萤火虫的相关概念对应起来,并借鉴萤火虫的活动规律形成了完整有效的搜索策略。萤火虫算法将搜索空间中的点看作自然界中萤火虫的个体,用待优化问题的目标函数评价萤火虫个体所处位置的好坏,将搜索更优解的过程融入成萤火虫个体受其他个体吸引移动位置的过程。在该算法中,随着萤火虫种群中个体的位置更新,好的可行解逐渐替代较差可行解,最终实现对目标问题的解的优化。
3.2. 萤火虫算法相关操作定义
面向矢量图生成问题,本文对萤火虫算法的相关操作进行了定义,以适应该问题的解决,具体定义如下。
1) 萤火虫位置
上述矢量图像由多个基本矢量图形组合而成,故萤火虫的位置可以由n维向量表示:
X
=
(
s
1
,
s
2
,
⋯
,
s
n
)
T (1)
其中
s
k
(
k
∈
{
1
,
2
,
⋯
,
n
}
) 为一个矢量图形。定义图形之间的差
s
1
−
s
2
=
t (2)
其中t为
s
2 向
s
1 的变换。
为衡量变换的幅度(图形间的差异),定义
|
t
| 为该变换的等价长度,其值由图形
s
1 和
s
2 在位置、形状、颜色上的差异决定。于是可以定义图形的变换
s
2
+
k
t
=
s
′
2
,
k
∈
[
0
,
1
] (3)
k 表示
s
2 遵循变换t的程度,当
0
<
k
<
1 时,
s
′
2 为一个介于
s
1 与
s
2 之间的图形。
2) 萤火虫移动
定义飞行向量
T
j
i
=
X
i
−
X
j
=
(
t
1
,
t
2
,
⋯
,
t
n
) (4)
表示在搜索空间中萤火虫由位置
X
j 变为
X
i 的飞行方向。定义位置
X
j 与
X
i 之间的距离为
|
T
j
i
|
=
|
t
1
|
2
+
|
t
2
|
2
+
⋯
+
|
t
n
|
2 (5)
于是在
k 时刻,由位置
X
1
k 向
X
2
k 飞行的萤火虫的位置可表示为
X
1
k
+
1
=
X
1
k
+
β
(
X
2
k
−
X
1
k
) (6)
其中
β 为吸引度,当
β
=
0 时,下一时刻萤火虫的位置
X
1
k
+
1
=
X
1
k ;当
β
=
1 时,萤火虫位置
X
1
k
+
1
=
X
2
k 。
β 的值与两萤火虫间的距离成平方反比,结合空气吸收效应的效果,可近似为
β
=
β
0
1
+
γ
|
T
|
2 (7)
其中
β
0 为
|
T
|
=
0 时的吸引度,取
β
0
=
1 ;
γ 为空气对光的吸收率,本文将其初始值取为
γ
=
(
|
T
max
|
4
)
2 (8)
其中
T
max 为理论上两位置间距离的最大值,上述
γ 表示当两萤火虫距离为
T
max
4 时,两萤火虫的间的吸引程度下降为距离最近时的一半。
萤火虫在
k 时刻的随机运动可表示为
X
k
+
1
=
X
k
+
α
T
rand (9)
其中
α 为步长,
T
rand 为一随机的飞行向量。
至此,萤火虫
i 受到萤火虫
j 吸引的运动行为可以表示如下:
X
i
=
X
i
+
β
0
1
+
γ
|
X
j
−
X
i
|
2
(
X
j
−
X
i
)
+
α
T
rand (10)
3) 适应度计算
对于本文中的矢量图生成算法,计算适应度需先将解X中图形在画布上依次绘制,得到一幅图像
P ,计算
P 与目标图像
P
′ 的对应像素在RGB颜色空间中的距离平方和,如下式
Δ
=
∑
[
(
R
i
−
R
′
i
)
2
+
(
G
i
−
G
′
i
)
2
+
(
B
i
−
B
′
i
)
2
] (11)
该式可以反映对应像素的颜色差异,进而反映两幅图像的差异程度,和越大则图像差异程度越大。最终适应度可由
Fitness
=
k
(
Δ
max
−
Δ
)
Δ
max (12)
得出,其中
Δ
max 为对于一个目标图像而言可能的最大差异值。当生成图形与目标完全一致时,适应度为k,而生成图形与目标图像完全不一致时,
Δ
=
Δ
max ,此时适应度为0。
3.3. 以划分子问题的方式运行算法
当图形数量较大时,搜索空间过大,萤火虫算法容易陷入局部最优解,为解决这个问题,本文将矢量图生成问题划分为数个子问题,对每个子问题分别运行优化算法,每个子问题的结果通过贪心策略连接成为整个问题的完整解。这种方式有效地减小了搜索空间,使得萤火虫算法在每个子问题的解决中发挥了较好的效果;同时该方法减小了每代需要变换和绘制的图形数量,提升了性能。
整体解决方式与划分子问题方式的对比如表1所示。在表1所示情况下,“生成
n 个基本图形”的问题被划分为
k 个“生成
n
/
k 个基本图形”的子问题,并串行执行,依次将图形加入最终的解向量中,直至图形数量达到要求,整个问题解决。
3.4. 基于萤火虫算法的矢量图生成算法
综上所述,算法步骤如下,流程图如图3。
(1) 初始化相关变量。根据输入的目标图像、图形个数、子问题个数,初始化画布、最大差异值
Δ
max 、矢量图
S 、萤火虫种群规模
N 。
Table 1. Difference between overall solution and problem-dividing solution
表1. 整体解决方式与划分子问题方式的区别
Figure 3. Flow chart
图3. 算法流程图
(2) 初始化萤火虫算法。生成萤火虫种群及相关参数。
(3) 计算萤火虫亮度并排序。计算每个萤火虫位置
X
i 的适应度,作为萤火虫的亮度,并按亮度排序,亮度最高的萤火虫位置为
X
M 。
(4) 判断是否满足萤火虫算法结束条件。若适应度达到要求或迭代次数达到上限,萤火虫算法结束,输出
X
M 中图形,转到步骤(5),否则转到步骤(4)。
(5)更新萤火虫位置。萤火虫受到比它更亮的萤火虫的吸引,位置根据式(10)更新,转到步骤(3)。
(6) 将输出的图形加入矢量图
S ,并绘制
S ,作为新的画布。
(7) 判断图形数是否满足要求。若此时
S 中图形数满足要求,将矢量图
S 保存到文件中,否则转到步骤(2)。
4. 实验与对比分析
为了验证算法效果,本文选用“Stuffed Toy”、“Sailboats”、“Union Jack”、“Pumpkin”和“Dog”五张图作为实验对象进行适量图像生成,实验的软硬件环境如表2所示。
Table 2. Experimental environment
表2. 实验环境
在最近吸引度
β
0
=
1 ,步长因子
α
=
0.3 ,萤火虫个数
N
=
5 的情况下,得到的输出结果如图4所示,图中从左自右分别为原图、本文方法输出图像和Chris Weller遗传算法 [1] 输出图像。
针对以上五张图片,对其执行本算法前后体积大小进行记录并计算压缩情况如下:(表3)
Table 3. Data record
表3. 数据记录
在还原度方面,我们采用Percent Correct [1] 进行描述,该值计算方式类似于式(12),可以线性地描述对目标图像的还原程度,计算方法为:
Percent
Correct
=
Δ
max
−
Δ
Δ
max
×
100
% (13)
Figure 4. Experimental result
图4. 实验结果
本文方法与Chris Weller遗传算法的对比如表4所示。从表中数据可以得出,普遍情况下本文算法可以进一步提高图片的还原度。
Table 4. Percent correct comparison
表4. 还原度对比
综合以上实验结果及数据,本文方法在矢量图生成问题上具有可行性,在还原度方向上较Chris Weller的遗传算法有一定量的提高,同时可以达到满意的压缩效果。
5. 结语
为了将光栅图转化为矢量图达到压缩体积的目的,本文研究了一种矢量图生成方法 [2] 的原理和特性,提出了一种基于萤火虫算法并结合了贪心策略的矢量图生成方法。最后对该方法进行了实验验证,并将结果与采用遗传算法的矢量图生成方法对比,表明本文方法能更有效地解决矢量图生成问题。