1.存取单个像素值

最通常的方法就是

img.at<uchar>(i,j) = 255; img.at<Vec3b>(i,j)[0] = 255;

2.用指针扫描一幅图像

对于一幅图像的扫描,用at就显得不太好了,还是是用指针的操作方法更加推荐。先介绍一种上一讲提到过的

for (int j=0; j<nl; j++) { uchar* data= image.ptr<uchar>(j); for (int i=0; i<nc; i++) { data[i] = 255; } }

更高效的扫描连续图像的做法可能是把W*H的衣服图像看成是一个1*(w*h)的一个一维数组,这个想法是不是有点奇葩,这里要利用isContinuous这个函数判断图像内的像素是否填充满,使用方法如下:

if (img.isContinuous()) { nc = img.rows*img.cols*img.channels(); } uchar* data = img.ptr<uchar>(0); for (int i=0; i<nc; i++) { data[i] = 255; }

更低级的指针操作就是使用Mat里的data指针,之前我称之为暴力青年,使用方法如下:

uchar* data = img.data; // img.at(i, j) data = img.data + i * img.step + j * img.elemSize();

 

3.用迭代器iterator扫描图像

和C++STL里的迭代器类似,Mat的迭代器与之是兼容的。是MatIterator_。声明方法如下:

cv::MatIterator_<Vec3b> it;

或者是:

cv::Mat_<Vec3b>::iterator it;

扫描图像的方法如下:

Mat_<Vec3b>::iterator it = img.begin<Vec3b>(); Mat_<Vec3b>::iterator itend = img.end<Vec3b>(); for (; it!=itend; it++) { (*it)[0] = 255; }

 

4.高效的scan image方案总结

要想减少程序运行的时间,必要的优化包括如下几个方面:

(1)内存分配是个耗时的工作,优化之;

(2)在循环中重复计算已经得到的值,是个费时的工作,优化之;举例:

int nc = img.cols * img.channels(); for (int i=0; i<nc; i++) {.......} //************************** for (int i=0; i<img.cols * img.channels(); i++) {......}

后者的速度比前者要慢上好多。

(3)使用迭代器也会是速度变慢,但迭代器的使用可以减少程序错误的发生几率,考虑这个因素,可以酌情优化

(4)at操作要比指针的操作慢很多,所以对于不连续数据或者单个点处理,可以考虑at操作,对于连续的大量数据,不要使用它

(5)扫描连续图像的做法可能是把W*H的衣服图像看成是一个1*(w*h)的一个一维数组这种办法也可以提高速度。短的循环比长循环更高效,即使他们的操作数是相同的

以上的这些优化可能对于大家的程序运行速度提高并不明显,但它们毕竟是个得到速度提升的好的编程策略,希望大家能多采纳。


我这里测试了三种操作Mat数据的办法,套用流行词,普通青年,文艺青年,为啥第三种我不叫2b青年,大家慢慢往后看咯。

普通青年的操作的办法通常是M.at<float>(i, j)

文艺青年一般会走路线M.ptr<float>( i )[ j ]

暴力青年通常直接强制使用我第40讲提到的M.data这个指针

实验代码如下:

t = (double)getTickCount();
  Mat img1(1000, 1000, CV_32F);
  
  for (int i=0; i<1000; i++)
  {
   for (int j=0; j<1000; j++)
   {
    img1.at<float>(i,j) = 3.2f;
   }
  }
  t = (double)getTickCount() - t;
  printf("in %gms\n", t*1000/getTickFrequency());
  //***************************************************************
  t = (double)getTickCount();
  Mat img2(1000, 1000, CV_32F);  for (int i=0; i<1000; i++)
  {
   for (int j=0; j<1000; j++)
   {
    img2.ptr<float>(i)[j] = 3.2f;
   }
  }
  t = (double)getTickCount() - t;
  printf("in %gms\n", t*1000/getTickFrequency());
  //***************************************************************
  t = (double)getTickCount();
  Mat img3(1000, 1000, CV_32F);
  float* pData = (float*)img3.data;  for (int i=0; i<1000; i++)
  {
   for (int j=0; j<1000; j++)
   {
    *(pData) = 3.2f;
    pData++;
   }
  }
  t = (double)getTickCount() - t;
  printf("in %gms\n", t*1000/getTickFrequency());
  //***************************************************************
  t = (double)getTickCount();
  Mat img4(1000, 1000, CV_32F);  for (int i=0; i<1000; i++)
  {
   for (int j=0; j<1000; j++)
   {
    ((float*)img3.data)[i*1000+j] = 3.2f;
   }
  }
  t = (double)getTickCount() - t;
  printf("in %gms\n", t*1000/getTickFrequency());

 最后两招可以都看成是暴力青年的方法,因为反正都是指针的操作,局限了各暴力青年手段就不显得暴力了。

在Debug、Release模式下的测试结果分别为:

测试结果

 

Debug

Release

普通青年

139.06ms

2.51ms

文艺青年

66.28ms

2.50ms

暴力青年1

4.95ms

2.28ms

暴力青年2

5.11ms

1.37ms

根据测试结果,普通青年的操作在Debug模式下果然缓慢,文艺青年的路线确实有提高。值得注意的是本来后两种办法确实是一种比较2b青年的做法,因为at操作符或者ptr操作符,其实都是有内存检查的,防止操作越界的,而直接使用data这个指针确实很危险。不过从速度上确实让人眼前一亮,所以我不敢称这样的青年为2b,尊称为暴力青年吧。

不过在Release版本下,几种办法的速度差别就不明显啦。所以如果大家最后发行程序的时候,可以不在意这几种操作办法的,推荐前两种哦,都是很好的写法,

推荐两种文艺青年的处理方案,测试了一下,先贴代码,再贴测试结果:

/*********加强版********/
  t = (double)getTickCount();
  Mat img5(1000, 1000, CV_32F);
  float *pData1;
  for (int i=0; i<1000; i++) 
  { 
   pData1=img5.ptr<float>(i);
   for (int j=0; j<1000; j++) 
   { 
    pData1[j] = 3.2f; 
   } 
  } 
  t = (double)getTickCount() - t;
  printf("in %gms\n", t*1000/getTickFrequency());
  /*******终极版*****/
  t = (double)getTickCount();
  Mat img6(1000, 1000, CV_32F);
  float *pData2;
  Size size=img6.size();
  if(img2.isContinuous())
  {
   size.width = size.width*size.height;
   size.height = 1;
  }
  size.width*=img2.channels();
  for(int i=0; i<size.height; i++)
  {
   pData2 = img6.ptr<float>(i);
   for(int j=0; j<size.width; j++)
   {
    pData2[j] = saturate_cast<float>(3.2f);
   }
  }
  t = (double)getTickCount() - t;
  printf("in %gms\n", t*1000/getTickFrequency());

测试结果:

 

Debug

Release

加强版文艺青年

5.74ms

2.43ms

终极版文艺青年

40.12ms

2.34ms

我的测试结果感觉这两种方案只是锦上添花的效果,也使大家的操作有了更多的选择,但感觉在速度上并没有数量级的提升,再次感谢箫铭对我blog的支持。后来箫铭说saturate_cast才把速度降下来,我很同意,就不贴上去测试结果了。但我查看资料了解了一下 saturate_cast 的作用。 可以看成是类型的强制转换,比如对于saturate_cast<uchar>来说,就是把数据转换成8bit的0~255区间,负值变成0,大于255的变成255。如果是浮点型的数据,变成round最近的整数 ,还是很有用处的函数,推荐大家在需要的时候尝试。