AI学习笔记之坐标变换与视觉测量
- 左右手坐标系即转换
- 左手坐标系、右手坐标系、笛卡尔坐标系
- 左手旋转规则、右手旋转规则
- 左手坐标系和右手坐标系相互转换
- 旋转矩阵
- 欧拉角与万向锁
- 欧拉角
- 万向锁
- 四元数
- 四元数的定义
- 四元数的几何意义
- 四元数求旋转矩阵
- 旋转矩阵求四元数
左右手坐标系即转换
左手坐标系、右手坐标系、笛卡尔坐标系
左手坐标系:伸开左手,大拇指指向X轴正方向,食指指向Y正反向,其他三个手指指向Z轴正方向。
右手坐标系:伸开右手,大拇指指向X轴正方向,食指指向Y正反向,其他三个手指指向Z轴正方向。
在高等数学中使用的三维空间是笛卡尔坐标系:
笛卡尔坐标系其实就是右手坐标系,OpenGL中使用右手坐标系,Direct3D使用的是左手坐标系。
左手旋转规则、右手旋转规则
左手坐标系和右手坐标系相互转换
位置(location)与位移(Translation)
位置与位移的转换是相同的,都是顶点位置,转换也比较简单,将X、Y、Z中任意一个取反即可。
旋转
右手坐标系下旋转RR,那么左手坐标系下的旋转应为:
注意,一定要和Location,Translation取反的值一致,也就是说Location是y轴取反,那么矩阵M一定要第二行为-1,其他两个周同理,要对应起来。
旋转矩阵
对于两个三维点,由点经过旋转矩阵旋转到,则有:
旋转矩阵为正交矩阵,满足
- 绕x轴旋转:
- 绕y轴旋转:
- 绕z轴旋转:
任何一个旋转可以表示为依次绕着三个旋转轴旋转三个角度的组合。这三个角度称为欧拉角。三个轴可以指固定的世界坐标系轴,也可以指被旋转物体坐标系的轴,三个旋转轴次序不同,会导致结果不同。
欧拉角与万向锁
欧拉角
欧拉角有两种:
1、静态:即绕世界坐标系三个轴的旋转,由于物体旋转过程中坐标轴保持静止,所以称为静态;
2、动态:即绕物体坐标系三个轴的旋转,由于五一旋转过程中坐标轴随着物体做相同的转动,所以称为动态。
使用动态欧拉角会出现万向锁现象,静态欧拉角不存在万向锁问题。
对于在三维空间里的一个参考系,任何坐标系的取向,都可以用三个欧拉角来表现。
参考系又称为实验室参考系,是静止不动的。
而坐标系则固定于刚体,随着刚体的旋转而旋转。
设定xyz-轴为参考系的参考周。称xy-平面与XY-平面的相交为交点线,用英文字母(N)代表。
zxz的欧拉角可以静态地这样定义:
- 是x-轴与交点线的夹角;
- 是z-轴与Z-轴的夹角;
- 是交点线与X-轴的夹角;
图中三个欧拉角分别为:
蓝色的轴为:xyz轴;红色的轴为:XYZ轴;绿色的线为交线:N
实际上,有许多方法可以设定两个坐标系的相对取向。欧拉角方法只是其中的一种。此外,不同的作者会用不同组合的欧拉角来描述,或用不同的名字表示同样的欧拉角。因此,在使用欧拉角之前,必须先做好明确的定义。
欧拉角的基本思想是将角位移分解为绕三个互相垂直的三个旋转组成的序列。所以,欧拉旋转的三个角,可以对应于三个旋转矩阵:
1、Yaw(偏航):欧拉角向量的y轴
2、Pitch(俯仰):欧拉角向量的x轴
3、Roll(翻滚):欧拉角向量的z轴
欧拉角的缺点
1、欧拉角的表示方式不唯一。给定某个其实朝向和坐标朝向,基石戈丁yaw、pitch、roll的顺序,也可以通过不同的yaw、pitch、roll的角度组合来表示所需的旋转。这其实主要是由于万向锁(Gimbal Lock)引起的;
2、欧拉角的插值比较难(以实现“平滑”旋转);
3、计算旋转变换时,一般需要转换成旋转矩阵,这时候需要计算很多sin,cos计算量较大。
由欧拉角求旋转矩阵
设三个轴x,y,z的欧拉角分别为,正弦值、余弦值分别为
由旋转矩阵求欧拉角
解方程得:
万向锁
正常状态:三个独立的旋转轴
万向锁:一旦选择±90°作为pitch角,就会导致第一次旋转和第三次旋转等价,整个旋转表示系统被限制在只能绕竖直轴旋转,表示丢失了一个维度。
- pitch是围绕x轴旋转,也叫做俯仰角;
- yaw是围绕y轴旋转,也叫做偏航角
- roll是围绕z轴旋转,也叫做翻滚角。
万向锁含义:当两个旋转轴重合时,导致只剩下2个旋转,2个旋转不能将所有情况进行描述,其产生的根本原因是绕三个轴的旋转不是同事进行的。
四元数
- 除了知名的数集(自然数、整数、实数、分数)之外,复数系统引入了一个新的数集——虚数。虚数的发明是为了解决一些特定无解的方程,例如
- 虚数有这样的形式:
- 复数的集合是一个实数和一个虚数的和,形式:(可以认为所有实数都是b=0的复数、所有虚数都是a=0的复数
- 拓展—复数的运算
- 四元数是简单的超复数。
- 四元数都是由实数加上三个虚数单位i、j、k组成,而且他们有如下联系:
- 每个四元数都是1、i、j和k的现行组合,及四元数一般表示为:
,其中a、b、c、d是实数。
四元数的定义
- 其中,均为实数,
- 对于i、j、k本身的几何意义可以理解为一种旋转,其中i代表x轴与y轴相交平面中x轴正方向向y轴正向的旋转,j旋转代表z轴与x轴相交平面中z轴正向向x轴正向的旋转,k旋转代表y轴与z轴相交平面中y轴正向向z轴正向的玄幻,-i、-j、-k分别代表i、j、k的反向旋转。
四元数的几何意义
- 三维空间的任意旋转,都可以用绕三维空间的某个轴旋转过某个角度来表示。
- 这种表示方法里,axis可用一个三维向量(x,y,z)来表示,可以用一个角度值来表示。
- 直观来讲,一个思维向量就可以表示三维空间任意的旋转。
- 注意,这里的三维向量(x,y,z)只是用来表示axis的方向朝向,因此更紧凑的表示方式是一个单位向量来表示axis,而用该三维向量的长度来表示角度值.
- 这样一来,可以用一个三维向量就可以表示三维空间任意的旋转,前提是其中(x,y,z)是单位向量。
- 这就是旋转向量(Rotation Vector)的表示方式。
四元数求旋转矩阵
- 已知四元数:$ q=q_0+q_1i+q_2j+q_3k=\lbrack s,v\rbrack$
- 利用Rodrigues公式可以由四元数求得旋转矩阵R:
旋转矩阵求四元数