详细介绍了图像处理中直方图均衡的原理,并借助OpenCV和GDAL,通过C/C++来直接操作内存buf来底层实现。





目录



1. OpenCV实现

在OpenCV中,实现直方图均衡化比较简单,调用equalizeHist函数即可。具体代码如下:

#include <iostream>
#include <opencv2\opencv.hpp>

using namespace std;
using namespace cv;

int main()
{
Mat srcImage;
srcImage = imread("D:\\Data\\imgDemo\\lena512color.bmp", IMREAD_GRAYSCALE);
imshow("原图像", srcImage);

Mat dstImage;
equalizeHist(srcImage, dstImage);
imshow("均衡后", dstImage);

waitKey();

return 0;
}


注意equalizeHist函数处理的是8位单波段的mat。运行结果如下所示,可以发现经过直方图均衡化之后,图像的对比度增强了很多。

图像处理之直方图均衡化拉伸_概率分布

2. 原理

直方图均衡化的基本思想是把原始图的直方图尽可能的均匀分布,其数学原理与数学中的概率论相关。注意,我这里很多论述牺牲了数学的严密性来加强可理解性,毕竟作者只是个应用者和使用者。

1) 概率密度函数

具体到一张图像上来说,可以把图像的灰度(像素值)ri看作是随机变量,则可以知道图像灰度的概率为:

图像处理之直方图均衡化拉伸_直方图_02

对应的,对于一个连续型的随机变量x,如果存在函数f(x)也满足上面两个条件:

图像处理之直方图均衡化拉伸_概率密度函数_03

则这个函数就是概率密度函数。

离散随机变量的概率有具体的公式让你理解,那么连续随机变量的概率密度函数具体的公式是怎么样的呢?这个概念其实需要下面要介绍的概率分布函数来理解。

2) 概率分布函数

概率分布函数就是是概率密度函数的变上限积分:

图像处理之直方图均衡化拉伸_直方图_04

通俗来讲,概率分布函数就是所有小于当前随机变量的概率累加。所以,概率分布函数也被叫做累积概率函数。

知道概率分布函数,引用下网上相关论述​[1]​就能更好的理解概率密度函数了:

图像处理之直方图均衡化拉伸_概率密度函数_05

3) 原理应用

直方图均衡化变换就是一种灰度级非线性变换,设r和s分别表示变换前和变换后的灰度,且r和s都进行了归一化的处理。则直方图均衡化变换的公式为:

图像处理之直方图均衡化拉伸_概率密度函数_06

即归一化后,直方图均衡化的结果s就是r的概率分布函数。

4) 原理推导

根据概率论随机变量的函数的分布的相关知识,有s的概率密度函数为

图像处理之直方图均衡化拉伸_直方图均衡化_07

以下​[2]​具体论述了其应用过程:

图像处理之直方图均衡化拉伸_概率分布_08

图像处理之直方图均衡化拉伸_概率密度函数_09

继续推导,有:

图像处理之直方图均衡化拉伸_直方图_10

其中s为r的概率分布函数,则:

图像处理之直方图均衡化拉伸_直方图均衡化_11

变换后变量s的概率密度为常数,说明其概率密度为均匀分布的。

3. 具体实现

根据第二节的论述,就知道直方图均衡化的具体操作了,可以分成以下几步:

  1. 读取源图像,统计源图像的直方图。
  2. 归一化直方图,统计源图像每个像素的概率密度值和概率分布值。
  3. 将每个像素的概率分布值恢复到 0 到 255 的区间,作为目标图像的像素。
  4. 写出目标图像。

其具体代码实现如下,我这里是采用 GDAL 来读取影像的,因为我想直接操作读

取的内存 buf,这样更底层一些。如果你不会使用 GDAL 也没有关系,你只需要

知道 GDAL 读取的是按照 RGBRGBRGB…排序的内存 buf。

#include <iostream>
#include <algorithm>
#include <gdal_priv.h>

using namespace std;

//直方图均衡化
void GetHistAvgLut(GUIntBig* anHistogram, int HistNum, vector<uint8_t > &lut)
{
//统计像素总的个数
size_t sum = 0;
for (int ci = 0; ci < HistNum; ci++)
{
sum = sum + anHistogram[ci];
}

//
vector<double> funProbability(HistNum, 0.0); //概率密度函数
vector<double> funProbabilityDistribution(HistNum, 0.0); //概率分布函数

//计算概率分布函数
double dsum = (double)sum;
double accumulation = 0;
for (int ci = 0; ci < HistNum; ci++)
{
funProbability[ci] = anHistogram[ci] / dsum;
accumulation = accumulation + funProbability[ci];
funProbabilityDistribution[ci] = accumulation;
}

//归一化的值扩展为0~255的像素值,存到颜色映射表
lut.resize(HistNum, 0);
for (int ci = 0; ci < HistNum; ci++)
{
double value = std::min<double>(std::max<double>(255 * funProbabilityDistribution[ci], 0), 255);
lut[ci] = (unsigned char)value;
}
}

//计算16位的颜色映射表
bool CalImgLut(GDALDataset* img, vector<vector<uint8_t>>& lut)
{
int bandNum = img->GetRasterCount(); //波段数
lut.resize(bandNum);

//
for (int ib = 0; ib < bandNum; ib++)
{
//计算该通道的直方图
int HistNum = 256;
GUIntBig* anHistogram = new GUIntBig[HistNum];
int bApproxOK = FALSE;
img->GetRasterBand(ib + 1)->GetHistogram(-0.5, 255.5, HistNum, anHistogram, TRUE, bApproxOK, NULL, NULL);

//直方图均衡化
GetHistAvgLut(anHistogram, HistNum, lut[ib]);

//
delete[] anHistogram;
anHistogram = nullptr;
}

return true;
}


int main()
{
//
GDALAllRegister(); //GDAL所有操作都需要先注册格式
CPLSetConfigOption("GDAL_FILENAME_IS_UTF8", "NO"); //支持中文路径

//读取
const char* imgPath = "D:\\Data\\imgDemo\\lena512color.bmp";
GDALDataset* img = (GDALDataset *)GDALOpen(imgPath, GA_ReadOnly);
if (!img)
{
cout << "Can't Open Image!" << endl;
return 1;
}

//
int imgWidth = img->GetRasterXSize(); //图像宽度
int imgHeight = img->GetRasterYSize(); //图像高度
int bandNum = img->GetRasterCount(); //波段数
int depth = GDALGetDataTypeSize(img->GetRasterBand(1)->GetRasterDataType()) / 8; //图像深度

//创建颜色映射表
vector<vector<uint8_t>> lut;
CalImgLut(img, lut);

//创建
GDALDriver *pDriver = GetGDALDriverManager()->GetDriverByName("BMP"); //图像驱动
char** ppszOptions = NULL;
const char* dstPath = "D:\\Data\\imgDemo\\dst.bmp";
int bufWidth = imgWidth;
int bufHeight = imgHeight;
GDALDataset* dst = pDriver->Create(dstPath, bufWidth, bufHeight, bandNum, GDT_Byte, ppszOptions);
if (!dst)
{
printf("Can't Write Image!");
return false;
}

//读取buf
size_t imgBufNum = (size_t)bufWidth * bufHeight * bandNum * depth;
GByte *imgBuf = new GByte[imgBufNum];
img->RasterIO(GF_Read, 0, 0, bufWidth, bufHeight, imgBuf, bufWidth, bufHeight,
GDT_Byte, bandNum, nullptr, bandNum*depth, bufWidth*bandNum*depth, depth);

//迭代通过颜色映射表替换值
for (int yi = 0; yi < bufHeight; yi++)
{
for (int xi = 0; xi < bufWidth; xi++)
{
for (int bi = 0; bi < bandNum; bi++)
{
size_t m = (size_t)bufWidth * bandNum * yi + bandNum * xi + bi;
imgBuf[m] = lut[bi][imgBuf[m]];
}
}
}

//写入
dst->RasterIO(GF_Write, 0, 0, bufWidth, bufHeight, imgBuf, bufWidth, bufHeight,
GDT_Byte, bandNum, nullptr, bandNum*depth, bufWidth*bandNum*depth, depth);

//释放
delete[] imgBuf;
imgBuf = nullptr;
GDALClose(dst);
dst = nullptr;
GDALClose(img);
img = nullptr;

return 0;
}


可以看到我这里统计了0到255的直方图之后,归一化计算每个像素的分布概率,再还原成0到255的值并预先生成了一个颜色映射表,最后直接通过这个颜色映射表进行灰度变换。这是图像处理的一种加速办法。最终得到的结果对比:

图像处理之直方图均衡化拉伸_概率密度函数_12

其直方图对比:

图像处理之直方图均衡化拉伸_直方图均衡化_13