目标:设计算法,根据一系列二维图像估计图中待测矩形物体的几何尺寸。

要求:误差小,运行速度快,占内存小,嵌入式平台,产品成本不能太高。

       

       最近接到领导任务,要求评估根据二维图像测量物体尺寸的算法可行性。现在将一些心得记录下,供自己整理思路,也方便有相关需求的同学参考。

       根据初步评估,大致确定三维重建算法将在以下三种中选择:

       1、线激光三角测量法:单目离线主动重建方法。以三角测量原理为基础,红外设备以一定的角度向物体投射红外线,光遇到物体后发生反射并被CCD(电荷耦合元件)图像传感器所检测。随着目标物体的移动,此时获取的反射光线也会产生相应的偏移值。根据发射角度、偏移距离、中心矩值和位置关系,便能计算出发射器到物体之间的距离。原理简单,成本低廉,在近距离下精度较高;但在远距离探测时误差呈几何量级增长,且在太阳直射下光斑无法检测。

       2、结构光法:单目离线主动重建方法。通过向表面光滑无特征的物体发射具有特征点的光线,依据光源中的立体信息辅助提取物体的深度信息。包括两个步骤:首先利用激光投影仪向目标物体投射可编码的光束,生成特征点;然后根据投射模式与投射光的几何图案,通过三角测量原理计算摄像机光心与特征点之间的距离,由此便可获取生成特征点的深度信息,实现模型重建。这种可编码的光束就是结构光,包括各种特定样式的点、线、面等图案。结构光法解决了物体表面平坦、纹理单一、灰度变化缓慢等问题,实现简单且精度较高,应用非常广泛(如微软公司的Kinect 1);但极易受光照影响,只适用于光线较暗的场景。

       3、飞行时间法(ToF):单目离线主动重建方法。通过测量发射信号与接收信号的飞行时间间隔来获得距离的方法,不需要进行特征匹配。这种信号可以是超声波,也可以是红外线等。与立体视觉法相比,具有不受基线长度限制、与纹理无关、成像速度快、算法实现简单等优点;但ToF相机的成本较高,分辨率非常低,容易受到环境因素的影响(如混合像素、外界光源等)导致景物深度不准确(但比结构光法受影响小),且系统误差与随机误差对测量结果的影响很大,需要进行后期数据处理,主要体现在场景像素点的位置重合上。

 

       总结:

       1、线激光法需要线激光器、红外光相机。成本低,适用于室内近距离场景,精度较高,开发难度中。

       2、结构光法需要结构光投影仪(条纹或网格)、红外光相机。成本较低,适用于室内近距离场景,精度较高,开发难度中。

       3、ToF需要ToF相机。成本较高,分辨率很低(万/十万像素级),可能需对数据进行后处理,精度中,误差不随距离改变(cm级),开发难度较低,体积小,实时性好,帧率高(上百fps)。

 

       上述方法当应用于手持设备时,若加上IMU惯性测量单元,对精度会有一定的提升。