Title :

  • cv::Mat
  • depth/dims/channels/step/data/elemSize

  • The class Mat represents an n-dimensional dense numerical single-channel or multi-channel array. It can be used to store (Mat类的对象用于表示一个多维度的单通道或者多通道稠密数组,它可以用来存储以下东西)
  • real or complex-valued vectors or matrices (实数值或复合值向量、矩阵)
  • grayscale or color images (灰度图或者彩色图)
  • voxel volumes (立体元素)
  • vector fields (矢量场)
  • point clouds (点云)
  • tensors (张量)
  • histograms (though, very high-dimensional histograms may be better stored in a SparseMat ) (直方图,高纬度的最好存放在SparseMat中)
  • 旧版本的OpenCV中的C结构体有 CvMat 和 CvMatND,目前我用的是 2.3 版,里面的文档指出 CvMat 和 CvMatND 弃用了,在C++封装中用 Mat 代替,另外旧版还有一个 IplImage,同样用 Mat 代替(可以参考博文 OpenCV中的结构体、类与Emgu.CV的对应表).
  • 矩阵 (M) 中数据元素的地址计算公式:

addr(Mi0,i1,…im-1) = M.data + M.step[0] * i0 + M.step[1] * i1 + … + M.step[m-1] * im-1 (其中 m = M.dims M的维度)

  • data:Mat对象中的一个指针,指向内存中存放矩阵数据的一块内存 (uchar* data)
  • dims:Mat所代表的矩阵的维度,如 3 * 4 的矩阵为 2 维, 3 * 4 * 5 的为3维
  • channels:通道,矩阵中的每一个矩阵元素拥有的值的个数,比如说 3 * 4 矩阵中一共 12 个元素,如果每个元素有三个值,那么就说这个矩阵是 3 通道的,即 channels = 3。常见的是一张彩色图片有红、绿、蓝三个通道。
  • depth:深度,即每一个像素的位数(bits),在opencv的Mat.depth()中得到的是一个 0 – 6 的数字,分别代表不同的位数:enum { CV_8U=0, CV_8S=1, CV_16U=2, CV_16S=3, CV_32S=4, CV_32F=5, CV_64F=6 }; 可见 0和1都代表8位, 2和3都代表16位,4和5代表32位,6代表64位;
  • step:是一个数组,定义了矩阵的布局,具体见下面图片分析,另外注意 step1 (step / elemSize1),M.step[m-1] 总是等于 elemSize,M.step1(m-1)总是等于 channels;
  • elemSize : 矩阵中每一个元素的数据大小,如果Mat中的数据的数据类型是 CV_8U 那么 elemSize = 1,CV_8UC3 那么 elemSize = 3,CV_16UC2 那么 elemSize = 4;记住另外有个 elemSize1 表示的是矩阵中数据类型的大小,即 elemSize / channels 的大小

图片分析1:考虑二维情况(stored row by row)按行存储

上面是一个 3 X 4 的矩阵,假设其数据类型为 CV_8U,也就是单通道的 uchar 类型

  • 这是一个二维矩阵,那么维度为 2 (M.dims == 2);
  • M.rows == 3; M.cols == 4;
  • sizeof(uchar) = 1,那么每一个数据元素大小为 1 (M.elemSize() == 1, M.elemSize1() == 1);
  • CV_8U 得到 M.depth() == 0, M.channels() == 1;
  • 因为是二维矩阵,那么 step 数组只有两个值, step[0] 和 step[1] 分别代表一行的数据大小和一个元素的数据大小,则 M.step[0] == 4, M.step[1] == 1;
  • M.step1(0) == M.cols = 4; M.step1(1) == 1;

假设上面的矩阵数据类型是 CV_8UC3,也就是三通道

  • M.dims == 2; M.channels() == 3;M.depth() == 0;
  • M.elemSize() == 3 (每一个元素包含3个uchar值) M.elemSize1() == 1 (elemSize / channels)
  • M.step[0] == M.cols * M.elemSize() == 12, M.step[1] == M.channels() * M.elemSize1() == M.elemSize() == 3;
  • M.step(0) == M.cols * M.channels() == 12 ; M.step(1) == M.channels() == 3;

图片分析2:考虑三维情况(stored plane by plane)按面存储

上面是一个 3 X 4 X 6 的矩阵,假设其数据类型为 CV_16SC4,也就是 short 类型

  • M.dims == 3 ; M.channels() == 4 ; M.elemSize1() == sizeof(short) == 2 ;
  • M.rows == M.cols == –1;
  • M.elemSize() == M.elemSize1() * M.channels() == M.step[M.dims-1] == M.step[2] == 2 * 4 == 8;
  • M.step[0] == 4 * 6 * M.elemSize() == 192;
  • M.step[1] == 6 * M.elemSize() == 48;
  • M.step[2] == M.elemSize() == 8;
  • M.step1(0) == M.step[0] / M.elemSize() == 48 / 2 == 96 (第一维度(即面的元素个数) * 通道数);
  • M.step1(1) == M.step[1] / M.elemSize() == 12 / 2 == 24(第二维度(即行的元素个数/列宽) * 通道数);
  • M.step1(2) == M.step[2] / M.elemSize() == M.channels() == 4(第三维度(即元素) * 通道数);

End :

Author : Ggicci

谢谢阅读,有误希望指正!