1.存取单个像素值
最通常的方法就是
img.at<uchar>(i,j) = 255; img.at<Vec3b>(i,j)[0] = 255;
2.用指针扫描一幅图像
对于一幅图像的扫描,用at就显得不太好了,还是是用指针的操作方法更加推荐。先介绍一种上一讲提到过的
for (int j=0; j<nl; j++) { uchar* data= image.ptr<uchar>(j); for (int i=0; i<nc; i++) { data[i] = 255; } }
更高效的扫描连续图像的做法可能是把W*H的衣服图像看成是一个1*(w*h)的一个一维数组,这个想法是不是有点奇葩,这里要利用isContinuous这个函数判断图像内的像素是否填充满,使用方法如下:
if (img.isContinuous()) { nc = img.rows*img.cols*img.channels(); } uchar* data = img.ptr<uchar>(0); for (int i=0; i<nc; i++) { data[i] = 255; }
更低级的指针操作就是使用Mat里的data指针,之前我称之为暴力青年,使用方法如下:
uchar* data = img.data; // img.at(i, j) data = img.data + i * img.step + j * img.elemSize();
3.用迭代器iterator扫描图像
和C++STL里的迭代器类似,Mat的迭代器与之是兼容的。是MatIterator_。声明方法如下:
cv::MatIterator_<Vec3b> it;
或者是:
cv::Mat_<Vec3b>::iterator it;
扫描图像的方法如下:
Mat_<Vec3b>::iterator it = img.begin<Vec3b>(); Mat_<Vec3b>::iterator itend = img.end<Vec3b>(); for (; it!=itend; it++) { (*it)[0] = 255; }
4.高效的scan image方案总结
要想减少程序运行的时间,必要的优化包括如下几个方面:
(1)内存分配是个耗时的工作,优化之;
(2)在循环中重复计算已经得到的值,是个费时的工作,优化之;举例:
int nc = img.cols * img.channels(); for (int i=0; i<nc; i++) {.......} //************************** for (int i=0; i<img.cols * img.channels(); i++) {......}
后者的速度比前者要慢上好多。
(3)使用迭代器也会是速度变慢,但迭代器的使用可以减少程序错误的发生几率,考虑这个因素,可以酌情优化
(4)at操作要比指针的操作慢很多,所以对于不连续数据或者单个点处理,可以考虑at操作,对于连续的大量数据,不要使用它
(5)扫描连续图像的做法可能是把W*H的衣服图像看成是一个1*(w*h)的一个一维数组这种办法也可以提高速度。短的循环比长循环更高效,即使他们的操作数是相同的
以上的这些优化可能对于大家的程序运行速度提高并不明显,但它们毕竟是个得到速度提升的好的编程策略,希望大家能多采纳。
我这里测试了三种操作Mat数据的办法,套用流行词,普通青年,文艺青年,为啥第三种我不叫2b青年,大家慢慢往后看咯。
普通青年的操作的办法通常是M.at<float>(i, j)
文艺青年一般会走路线M.ptr<float>( i )[ j ]
暴力青年通常直接强制使用我第40讲提到的M.data这个指针
实验代码如下:
t = (double)getTickCount();
Mat img1(1000, 1000, CV_32F);
for (int i=0; i<1000; i++)
{
for (int j=0; j<1000; j++)
{
img1.at<float>(i,j) = 3.2f;
}
}
t = (double)getTickCount() - t;
printf("in %gms\n", t*1000/getTickFrequency());
//***************************************************************
t = (double)getTickCount();
Mat img2(1000, 1000, CV_32F); for (int i=0; i<1000; i++)
{
for (int j=0; j<1000; j++)
{
img2.ptr<float>(i)[j] = 3.2f;
}
}
t = (double)getTickCount() - t;
printf("in %gms\n", t*1000/getTickFrequency());
//***************************************************************
t = (double)getTickCount();
Mat img3(1000, 1000, CV_32F);
float* pData = (float*)img3.data; for (int i=0; i<1000; i++)
{
for (int j=0; j<1000; j++)
{
*(pData) = 3.2f;
pData++;
}
}
t = (double)getTickCount() - t;
printf("in %gms\n", t*1000/getTickFrequency());
//***************************************************************
t = (double)getTickCount();
Mat img4(1000, 1000, CV_32F); for (int i=0; i<1000; i++)
{
for (int j=0; j<1000; j++)
{
((float*)img3.data)[i*1000+j] = 3.2f;
}
}
t = (double)getTickCount() - t;
printf("in %gms\n", t*1000/getTickFrequency());
最后两招可以都看成是暴力青年的方法,因为反正都是指针的操作,局限了各暴力青年手段就不显得暴力了。
在Debug、Release模式下的测试结果分别为:
测试结果
| Debug | Release |
普通青年 | 139.06ms | 2.51ms |
文艺青年 | 66.28ms | 2.50ms |
暴力青年1 | 4.95ms | 2.28ms |
暴力青年2 | 5.11ms | 1.37ms |
根据测试结果,普通青年的操作在Debug模式下果然缓慢,文艺青年的路线确实有提高。值得注意的是本来后两种办法确实是一种比较2b青年的做法,因为at操作符或者ptr操作符,其实都是有内存检查的,防止操作越界的,而直接使用data这个指针确实很危险。不过从速度上确实让人眼前一亮,所以我不敢称这样的青年为2b,尊称为暴力青年吧。
不过在Release版本下,几种办法的速度差别就不明显啦。所以如果大家最后发行程序的时候,可以不在意这几种操作办法的,推荐前两种哦,都是很好的写法,
推荐两种文艺青年的处理方案,测试了一下,先贴代码,再贴测试结果:
/*********加强版********/
t = (double)getTickCount();
Mat img5(1000, 1000, CV_32F);
float *pData1;
for (int i=0; i<1000; i++)
{
pData1=img5.ptr<float>(i);
for (int j=0; j<1000; j++)
{
pData1[j] = 3.2f;
}
}
t = (double)getTickCount() - t;
printf("in %gms\n", t*1000/getTickFrequency());
/*******终极版*****/
t = (double)getTickCount();
Mat img6(1000, 1000, CV_32F);
float *pData2;
Size size=img6.size();
if(img2.isContinuous())
{
size.width = size.width*size.height;
size.height = 1;
}
size.width*=img2.channels();
for(int i=0; i<size.height; i++)
{
pData2 = img6.ptr<float>(i);
for(int j=0; j<size.width; j++)
{
pData2[j] = saturate_cast<float>(3.2f);
}
}
t = (double)getTickCount() - t;
printf("in %gms\n", t*1000/getTickFrequency());
测试结果:
| Debug | Release |
加强版文艺青年 | 5.74ms | 2.43ms |
终极版文艺青年 | 40.12ms | 2.34ms |
我的测试结果感觉这两种方案只是锦上添花的效果,也使大家的操作有了更多的选择,但感觉在速度上并没有数量级的提升,再次感谢箫铭对我blog的支持。后来箫铭说saturate_cast才把速度降下来,我很同意,就不贴上去测试结果了。但我查看资料了解了一下
saturate_cast
的作用。
可以看成是类型的强制转换,比如对于saturate_cast<uchar>来说,就是把数据转换成8bit的0~255区间,负值变成0,大于255的变成255。如果是浮点型的数据,变成round最近的整数
,还是很有用处的函数,推荐大家在需要的时候尝试。