介绍¶
OpenCV(开源计算机视觉库:http://opencv.org)是一个开源的BSD许可库,包含数百种计算机视觉算法。该文档描述了所谓的OpenCV 2.x API,它本质上是一个C ++ API,与基于C的OpenCV 1.x API相反。后者在opencv1x.pdf中描述。
OpenCV具有模块化结构,这意味着该包包含多个共享库或静态库。可以使用以下模块:
- core - 一个紧凑的模块,定义基本的数据结构,包括密集的多维数组Mat和所有其他模块使用的基本功能。
- imgproc - 图像处理模块,包括线性和非线性图像滤波,几何图像变换(调整大小,仿射和透视扭曲,基于通用表的重新映射),颜色空间转换,直方图等。
- video - 视频分析模块,包括运动估计,背景减法和对象跟踪算法。
- calib3d - 基本的多视图几何算法,单一和立体摄像机校准,对象姿态估计,立体对应算法和3D重建元素。
- features2d - 出色的特征检测器,描述符和描述符匹配器。
- objdetect - 检测预定义类的对象和实例(例如,面部,眼睛,马克杯,人,汽车等)。
- highgui - 易于使用的视频捕获,图像和视频编解码器界面,以及简单的UI功能。
- gpu - 来自不同OpenCV模块的GPU加速算法。
- 一些其他帮助器模块,例如FLANN和Google测试包装器,Python绑定等
API概念
cv命名空间
所有OpenCV类和函数都放在cv命名空间中。因此,要从代码中访问此功能,请使用 cv:: 符或using namespace cv ;指示:
或者:
某些当前或未来的OpenCV外部名称可能与STL或其他库冲突。在这种情况下,使用显式名称空间说明符来解决名称冲突:
自动内存管理
OpenCV自动处理所有内存
首先,函数和方法使用的std :: vector,Mat和其他数据结构都有析构函数,可以在需要时释放底层内存缓冲区。这意味着析构函数并不总是释放缓冲区,就像Mat一样。他们考虑了可能的数据共享。析构函数递减与矩阵数据缓冲区关联的引用计数器。当且仅当引用计数器达到零时,即当没有其他结构引用相同的缓冲区时,缓冲区被释放。同样,复制Mat实例时,实际上并未复制任何实际数据。相反,引用计数器递增以记住存在相同数据的另一个所有者。还有Mat :: clone方法可以创建矩阵数据的完整副本。请参阅以下示例:
你看到Mat和其他基本结构的使用很简单。但是,如果不考虑自动内存管理而创建的高级类甚至用户数据类型呢?对于他们来说,OpenCV提供的Ptr <>模板类与C ++ TR1中的std :: shared_ptr类似。所以,而不是使用普通指针:
您可以使用:
也就是说,Ptr <T> ptr封装指向T实例的指针和与指针相关联的引用计数器。有关详细信息,请参阅Ptr说明。
输出数据的自动分配
OpenCV自动释放内存,并在大多数时间自动为输出函数参数分配内存。因此,如果函数具有一个或多个输入数组(cv :: Mat实例)和一些输出数组,则会自动分配或重新分配输出数组。输出数组的大小和类型由输入数组的大小和类型决定。如果需要,函数会采用额外的参数来帮助确定输出数组属性。
例如:
由于视频帧分辨率和比特深度对于视频捕获模块是已知的,所以阵列帧由 >> 运算符自动分配。数组边缘由cvtColor函数自动分配。它具有与输入数组相同的大小和位深度。通道数为1,因为颜色转换代码CV_BGR2GRAY被传递,这意味着颜色到灰度转换。请注意,在第一次执行循环体时,帧和边仅分配一次,因为所有下一个视频帧具有相同的分辨率。如果以某种方式更改视频分辨率,则会自动重新分配阵列。
该技术的关键组件是Mat :: create方法。它需要所需的数组大小和类型。如果数组已具有指定的大小和类型,则该方法不执行任何操作。否则,它释放先前分配的数据(如果有的话)(这部分涉及递减引用计数器并将其与零比较),然后分配所需大小的新缓冲区。大多数函数为每个输出数组调用Mat :: create方法,因此实现了自动输出数据分配。
这个方案的一些值得注意的例外是cv :: mixChannels,cv :: RNG :: fill,以及一些其他函数和方法。它们无法分配输出数组,因此您必须提前执行此操作。
饱和度算术
作为计算机视觉库,OpenCV对图像像素进行了大量处理,这些像素通常以紧凑的,每通道8位或16位编码形式,因此具有有限的值范围。此外,对图像的某些操作,如色彩空间转换,亮度/对比度调整,锐化,复杂插值(双立方,Lanczos)可以产生超出可用范围的值。如果只存储结果的最低8(16)位,则会导致视觉伪影,并可能影响进一步的图像分析。为了解决这个问题,使用所谓的饱和算术。例如,要将操作结果r存储到8位图像,您会在0..255范围内找到最接近的值:
类似的规则适用于8位带符号的16位有符号和无符号类型。这种语义在库中的任何地方都使用。在C ++代码中,它使用类似于标准C ++强制转换操作的saturate_cast <>函数完成。见下文上面提供的公式的实施:
其中cv :: uchar是OpenCV 8位无符号整数类型。在优化的SIMD代码中,使用诸如paddusb,packuswb等的SSE2指令。它们有助于实现与C ++代码完全相同的行为。
注意:当结果为32位整数时,不应用饱和度。
固定像素类型。模板的有限使用
模板是C ++的一个很好的特性,它可以实现非常强大,高效且安全的数据结构和算法。但是,广泛使用模板可能会大大增加编译时间和代码大小。此外,当专门使用模板时,很难将界面和实现分开。这对于基本算法来说可能很好,但对于计算机视觉库来说并不好,其中单个算法可能跨越数千行代码。正因为如此,并且还简化了其他语言的绑定开发,例如Python,Java,Matlab,它们根本没有模板或具有有限的模板功能,当前的OpenCV实现基于多态和模板上的运行时调度。在那些运行时调度速度太慢的地方(如像素访问运算符),不可能(通用Ptr <>实现),或者只是非常不方便(saturate_cast <>())当前的实现引入了小模板类,方法和函数。在当前OpenCV版本的任何其他地方,模板的使用都是有限的。
因此,库可以操作有限的固定原始数据类型集。也就是说,数组元素应该具有以下类型之一:
- 8-bit unsigned integer (uchar)
- 8-bit signed integer (schar)
- 16-bit unsigned integer (ushort)
- 16-bit signed integer (short)
- 32-bit signed integer (int)
- 32-bit floating-point number (float)
- 64-bit floating-point number (double)
- a tuple of several elements where all elements have the same type (one of the above). An array whose elements are such tuples, are called multi-channel arrays, as opposite to the single-channel arrays, whose elements are scalar values. The maximum possible number of channels is defined by the
CV_CN_MAX
constant, which is currently set to 512.(所有元素具有相同类型(上述之一)的几个元素的元组。元素为元组的数组称为多通道数组,与单通道数组相反,其元素为标量值。最大可能的通道数由CV_CN_MAX常量定义,该常量当前设置为512。)
对于这些基本类型,应用以下枚举:
可以使用以下选项指定多通道(n通道)类型:
- CV_8UC1 ... CV_64FC4常量(对于1到4的多个通道)
- 当通道数大于4或在编译时未知时,CV_8UC(n)... CV_64FC(n)或CV_MAKETYPE(CV_8U,n)... CV_MAKETYPE(CV_64F,n)宏。
注意:CV_32FC1 == CV_32F
, CV_32FC2 == CV_32FC(2) == CV_MAKETYPE(CV_32F, 2)
, and CV_MAKETYPE(depth, n) == (depth&7) +((n-1)<<3)
. 这意味着常量类型由深度形成,取最低3位,通道数减1,取下一个log2(CV_CN_MAX)位。
例子:
使用OpenCV无法构造或处理具有更复杂元素的数组。此外,每个函数或方法只能处理所有可能的数组类型的子集。通常,算法越复杂,支持的格式子集越小。请参阅以下这些限制的典型示例:
- 人脸检测算法仅适用于8位灰度或彩色图像。
- 线性代数函数和大多数机器学习算法仅适用于浮点数组。
- 基本功能,如cv :: add,支持所有类型
- 色彩空间转换功能支持8位无符号,16位无符号和32位浮点类型。
每个功能的受支持类型的子集已根据实际需要进行定义,并可根据用户请求在将来进行扩展。
InputArray和OutputArray
许多OpenCV函数处理密集的二维或多维数值数组。通常,这样的函数使用cpp:class:Mat作为参数,但在某些情况下,使用std :: vector <>(例如:点集)或Matx <>(例如:3x3单应矩阵等)更方便。为了避免API中的许多重复,引入了特殊的“代理”类。基础“代理”类是InputArray。它用于在函数输入上传递只读数组。从InputArray类派生的OutputArray用于指定函数的输出数组。通常,您不应该关心那些中间类型(并且您不应该明确声明这些类型的变量) - 它们都将自动运行。您可以假设您可以使用Mat,std :: vector <>,Matx <>,Vec <>或Scalar来代替InputArray / OutputArray。当一个函数有一个可选的输入或输出数组,并且参数没有你想要的任何一个时,传递cv :: noArray()。
错误处理
OpenCV使用异常来表示严重错误。当输入数据格式正确且属于指定的值范围时,算法由于某种原因无法成功(例如,优化算法没有收敛),它返回一个特殊的错误代码(通常只是一个布尔变量)。
异常可以是cv :: Exception类或其派生类的实例。反过来,cv :: Exception是std :: exception的衍生物。因此,可以使用其他标准 C ++库组件在代码中优雅地处理它。
通常使用CV_Error(错误代码,描述)宏抛出异常,或其类似printf的CV_Error_(错误代码,printf-spec,(printf-args))变体,或使用CV_Assert(条件)宏检查条件,并在不满足时抛出异常。对于性能关键代码,CV_DbgAssert(条件)仅保留在Debug配置中。由于自动内存管理,所有中间缓冲区在发生突然错误时会自动解除分配。如果需要,您只需要添加try语句来捕获异常:
多线程和Re-enterability(重新连接
当前的OpenCV实现是完全可以重新输入的。也就是说,可以从不同的线程调用类实例的相同的函数,相同常量方法或者不同类实例的相同非常量方法(non-constant method)。此外,相同的cv :: Mat可以在不同的线程中使用,因为引用计数操作使用特定于体系结构的原子指令。