文章目录

  • 一、颜色特征提取
  • 1.1颜色直方图
  • 1.1.1一般颜色直方图
  • 1.1.2全局累加直方图
  • 1.1.3主色调直方图
  • 1.2颜色矩
  • 1.3颜色集
  • 1.4颜色聚合向量


1.特征代表性和可区分性
一幅图像中不同类别的对象差异越大越好。比如在区分乒乓球和足球时,图像的纹理特征就是很不错的特征,因为足球一般有六边形纹理结构,而乒乓球没有。
2.稳定性
同一类别图像的特征应该具有类似的特征值。保证类别内图像的相似度大于类别间图像的相似度。如,在区分成熟的苹果与不成熟的苹果时,颜色是一个比较好的特征,因为不成熟的苹果通常呈青色而成熟的苹果通常呈黄色或红色尺寸大小这个特征在区分苹果成熟与否时,不是一个稳定的特征
3.独立性
图像特征应该彼此独立,尽量减少彼此的关联性,图像之间的关联性会影响内容的表达。如,苹果的直径和苹果的终了就属于关联性较强的两个特征,他们都可以反映苹果的大小,如果同时使用两个特征就会显得冗余。

一、颜色特征提取

1.1颜色直方图

颜色直方图用于描述图像中像素颜色的数值分布情况,可以反映图像颜色的统计分布和图像的基本色调。

1.1.1一般颜色直方图

假设iOS 图片识别框 苹果 图片识别_相似度 为图像iOS 图片识别框 苹果 图片识别_颜色直方图_02中某一特定颜色iOS 图片识别框 苹果 图片识别_相似度_03的像素个数,图像iOS 图片识别框 苹果 图片识别_颜色直方图_02中像素总数为iOS 图片识别框 苹果 图片识别_颜色直方图_05,则iOS 图片识别框 苹果 图片识别_iOS 图片识别框_06像素出现的频率为
iOS 图片识别框 苹果 图片识别_直方图_07
整个图像iOS 图片识别框 苹果 图片识别_颜色直方图_02的一般颜色直方图可以表示为
iOS 图片识别框 苹果 图片识别_iOS 图片识别框_09
其中n表示某类颜色取值的个数。

一般图像的直方图如下

iOS 图片识别框 苹果 图片识别_相似度_10


iOS 图片识别框 苹果 图片识别_相似度_11


一般颜色直方图法对图像的旋转、小幅平移、小幅缩放等变换不敏感,对图像质量的变化也不敏感。

1.1.2全局累加直方图

假设图像iOS 图片识别框 苹果 图片识别_iOS 图片识别框_12中的某一特征的一般颜色直方图为iOS 图片识别框 苹果 图片识别_直方图_13,令
iOS 图片识别框 苹果 图片识别_相似度_14
表示颜色小于或者等于iOS 图片识别框 苹果 图片识别_颜色直方图_15的所有元素的一般颜色直方图的累加和,则图像iOS 图片识别框 苹果 图片识别_直方图_16的该类特征累加直方图可以表示为:
iOS 图片识别框 苹果 图片识别_iOS 图片识别框_17
像素值相邻的频数在全局累加直方图的位置也相邻

你可以这样去理解,一般颜色直方图相当于一个概率密度函数,而全局累加直方图是一个分布函数,也就是累加直方图是一般直方图的积分
iOS 图片识别框 苹果 图片识别_相似度_18
iOS 图片识别框 苹果 图片识别_iOS 图片识别框_19

1.1.3主色调直方图

在一幅图像中,不同颜色值出现的概率不同,而且通常情况少数几种颜色就能涵盖整个图像的主色调。

主色调直方图就是计算每种颜色出现的频率,选择频率最高的颜色作为主色调,主色调直方图能够抑制图像中噪声的影响。

1.2颜色矩

矩是一种重要的统计量,常用于表征数据的分布特点。在统计中,一阶矩表示均值,二阶矩表示方差,三阶矩表示偏移度。图像的颜色矩用于对图像内的颜色分布进行表征。

  • 对于数字图像,一阶矩定义为:
    iOS 图片识别框 苹果 图片识别_相似度_20
    其中iOS 图片识别框 苹果 图片识别_相似度_21表示数字图像iOS 图片识别框 苹果 图片识别_直方图_22的第iOS 图片识别框 苹果 图片识别_iOS 图片识别框_23个图像通道的第iOS 图片识别框 苹果 图片识别_直方图_24个像素的值,iOS 图片识别框 苹果 图片识别_相似度_25表示图像中像素的个数
  • 二阶矩定义为:
    iOS 图片识别框 苹果 图片识别_相似度_26
  • 三阶颜色矩定义为:
    iOS 图片识别框 苹果 图片识别_相似度_27

1.3颜色集

颜色集又可以称为颜色索引集,其是对图像颜色直方图的一种近似。颜色集方法的步骤是:将图像从RGB空间转换到HSV空间,并将颜色空间量化为若干个边长均等的小立方体;第二,根据图像的色彩将图像划分为若干个子区域;第三,使用量化空间中的某个颜色分类索引每个子区域,将图像表示为一个二进制的颜色索引集。

最简单的颜色集可以通过设置阈值的方式。例如给定某一颜色值iOS 图片识别框 苹果 图片识别_直方图_28,给定其阈值iOS 图片识别框 苹果 图片识别_直方图_29,由颜色直方图生成颜色集iOS 图片识别框 苹果 图片识别_直方图_30可表示为
iOS 图片识别框 苹果 图片识别_相似度_31
其中iOS 图片识别框 苹果 图片识别_相似度_32表示直方图中颜色值为iOS 图片识别框 苹果 图片识别_直方图_28对应的位置处的分量

1.4颜色聚合向量

颜色集合向量的核心思想是将颜色直方图的每个颜色量化区间的像素分为两部分,如果该颜色量化区间中的某些像素占据的连续区域大于指定阈值,则将该区域内的像素作为聚合像素,否则为非聚合像素

颜色聚合向量可表示为iOS 图片识别框 苹果 图片识别_相似度_34,其中iOS 图片识别框 苹果 图片识别_颜色直方图_35iOS 图片识别框 苹果 图片识别_颜色直方图_36分别代表颜色直方图的第iOS 图片识别框 苹果 图片识别_颜色直方图_37个颜色量化区间中的聚合像素和非聚合像素的数量。