一、问题引出
最近看到stackflow关于minAreaRect的讨论:
- MinAreaRect angles - Unsure about the angle returned
- OpenCV’s RotatedRect angle does not provide enough information
大概问题是minAreaRect这个接口返回的角度信息不足以反映返回的旋转矩形的旋转信息,例如返回角度为30度,那它到底是下面图中的哪一个呢?
那有人回答说OpenCV返回的角度是根据长边来的,是长边与竖直线之间的角度,如要使用那个角度就需要通过返回的size信息与角度信息结合就知道了。
他这么理解我暂时也没发现什么问题,但如果你想利用这个角度做些事情,这样理解可能不是很方便。因为你还得根据当前的角度去计算新的角度,例如给定与旋转矩形相同大小的矩形,让你旋转到旋转矩形的角度,可能就得想半天了。这里提供一个可能会更好理解的方式。
我们先来看一下,当给定一个旋转矩形后,通过minAreaRect接口返回的角度和返回的宽高来查看OpenCV是怎么旋转的。(注意这里使用的4.1.2版本的OpenCV,其它版本可能不一致,我遇到过只返回正值角度的版本,但这影响使用本文方法理解)
我们有如下两种旋转矩形
左图opencv返回的是-30度,size为(365, 47)
右图opencv返回的是-60度,size为(47, 365)
二、OpenCV是怎么“想”的
我们怎么理解它是怎么得到这些旋转角度的旋转矩形呢?根据返回的宽高结果,可以这样想,上图中左图是宽大于高的矩形旋转得到的,右图是使用高大于宽的矩形旋转得到的,所以初始状态分别为如下两图:
然后两种框分别绕着矩形框中心逆时针旋转对应的角度(左图旋转30,右图旋转60度就得到了)。(至于这里为什么是顺时针旋转,这里跟返回值的正负无关,上面提到过有的版本会返回正值,具体可以根据你用的版本检查一下是否是顺时针。)
三、怎么通过minAreaRect返回的角度用于自己的计算
现在假定我们的任务是根据获取到的旋转角度,对一个相同大小的矩形进行旋转对应的角度。
我们假设所有矩形的初始状态都是宽大于高的情况,如下图所示
当我们有一个上图这样的初始化矩形后,怎么分别旋转到左右两图两种情况呢?
首先需要说明的是旋转操作我们采用cv2.getRotationMatrix2D接口,这个接口需要提供旋转中心,旋转角度,缩放值三个参数。
旋转中心就是当前矩形框的中心,缩放值设为1就是不缩放,重点是角度的计算。
对于左图,它在opencv的旋转方式里,初始化就是宽大于高的框,所以只需要对应的转30就可以了,至于是正30还是负30(逆时针还是顺时针),我们这里明显是逆时针,所以根据当前版本的OpenCV返回角度取反就可以了。
对于右图,它在opencv的旋转方式里,初始化是高大于宽的框,所以我们需要先将我们假设的框转90度或者-90度,然后在逆时针旋转60即可。为了方便计算,前面水平框逆时针旋转90再逆时针旋转60即可,就是90+60度。
Talk is cheap, the code is below:
import cv2.cv2 as cv2
import numpy as np
print(cv2.__version__)
def drawPolygons(img, polygon, scalar):
poly = polygon.reshape((-1, 1, 2)).astype(np.int)
cv2.polylines(img, [poly], True, scalar, 2)
def get_horizontal_rect(center, size):
points = np.zeros((2, 2))
points[0] = center - size / 2.0
points[1] = center + size / 2.0
horizontal_rect = np.array([points[0],
[points[1][0], points[0][1]],
points[1],
[points[0][0],points[1][1]]])
return horizontal_rect
if __name__ == "__main__":
img = np.ones((640, 640, 3), dtype=np.uint8) * 255
points = np.array([[29, 200],
[346, 18],
[370, 59],
[53, 241]])
# points = np.array([[52, 17],
# [369, 200],
# [346, 241],
# [29, 58]])
rotated_bbox = cv2.minAreaRect(points)
rotated_bbox_center, rotated_bbox_size, rotated_bbox_angle = rotated_bbox
rotated_bbox_size = np.array(list(rotated_bbox_size))
print(rotated_bbox)
rect_bbox = cv2.boxPoints(rotated_bbox).astype(np.int)
# drawPolygons(img, points, (255, 0, 0))
drawPolygons(img, rect_bbox, (0, 255, 0))
new_img = np.ones((640, 640, 3), dtype=np.uint8) * 122
width, height = rotated_bbox_size
if width < height:
rotated_bbox_size = np.array([height, width])
rotated_bbox_angle = rotated_bbox_angle - 90
horizontal_rect = get_horizontal_rect(rotated_bbox_center, rotated_bbox_size)
# drawPolygons(new_img, horizontal_rect, (0, 255, 255))
# 输入角度为正值表示逆时针旋转
rot_matrix = cv2.getRotationMatrix2D(rotated_bbox_center, -rotated_bbox_angle, 1.0)
print("rot_matrix: ", rot_matrix)
horizontal_rect = np.concatenate([horizontal_rect, np.ones((len(horizontal_rect), 1))], axis=-1)
rot_box = horizontal_rect @ rot_matrix.T
rot_box = rot_box.astype(np.int)
drawPolygons(new_img, rot_box, (255, 0, 0))
print(horizontal_rect, rot_box)
concat_img = np.concatenate([img, new_img], axis=1)
cv2.imshow('img', concat_img)
cv2.waitKey(0)