目录

  • 基于预测控制的多架小型直升机编队飞行控制
  • 编队控制
  • Leader–Follower 系统
  • 基于模型预测控制的控制器设计
  • 速度控制模型
  • 平动模型
  • 模型预测控制器设计
  • 模型预测控制
  • 控制器设计


基于预测控制的多架小型直升机编队飞行控制

本部分将介绍多架小型无人直升机编队飞行控制,作为 UAV 高级控制的一个示例。自主编队飞行控制系统设计为“领导者–跟随”模型。为了在系统约束下获得良好的控制性能,将“模型预测控制”应用于随动直升机的平动位置控制。在实时最优控制计算中,考虑了运动范围和避碰等位置约束。为了实现对干扰的鲁棒性,使用最小阶干扰观测器来估计不可测量的状态变量和干扰。

编队控制

以鸟类和鱼类为灵感的编队控制是多交通工具系统中的热门话题。在无人机的自主飞行控制中,除了稳定性外,还需要高控制性能。具体可参考机器人编队控制。

在本部分中。首先将直升机动力学建模为线性状态空间方程。其次,利用模型预测控制(MPC)设计了每个跟随器的位置控制器。成本函数以具有终端状态成本的线性二次型形式表示。此外,它还被扩充为一种反映避碰机动和通信范围的形式。

Leader–Follower 系统

此处由于考虑的是直升机,因而 leader 和 follower 之间的追踪可视为一个二维追踪,即 强化学习无人机编队 无人机编队控制原理_其他

  • 强化学习无人机编队 无人机编队控制原理_无人机_02
  • 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_03
  • 强化学习无人机编队 无人机编队控制原理_预测控制_04 是 follower 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_05
  • 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_06 是 leader 的方向角。

基于模型预测控制的控制器设计

本部分介绍一种分层制导控制器的设计方法,该控制器可使每个跟随者跟踪到指定的参考目标和编队结构。

速度控制模型

首先介绍一个基于修正速度模型 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_07

具体而言,现考虑的坐标体系如下图所示。但由于直升机的平动与垂直运动可以独立考虑,在仅考虑平动时,坐标轴取 强化学习无人机编队 无人机编队控制原理_其他_08

强化学习无人机编队 无人机编队控制原理_模型预测_09

平动模型

假设其平动速率上界为 强化学习无人机编队 无人机编队控制原理_其他_10 m/s,记 强化学习无人机编队 无人机编队控制原理_无人机_11强化学习无人机编队 无人机编队控制原理_预测控制_12,其平动模型为 强化学习无人机编队 无人机编队控制原理_其他_13 其中,强化学习无人机编队 无人机编队控制原理_预测控制_14强化学习无人机编队 无人机编队控制原理_模型预测_15强化学习无人机编队 无人机编队控制原理_其他_16强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_17

  • 由于速度的测量是在惯性系下进行的,因而需要坐标变换 强化学习无人机编队 无人机编队控制原理_模型预测_18 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_19 进而得到系统模型为 强化学习无人机编队 无人机编队控制原理_无人机_20
  • 基于上述模型,将性能指标降至最低的反馈控制输入为 强化学习无人机编队 无人机编队控制原理_预测控制_21
  • 进一步地,速度闭环系统为 强化学习无人机编队 无人机编队控制原理_无人机_22 则平移位置模型为 强化学习无人机编队 无人机编队控制原理_预测控制_23 其中,强化学习无人机编队 无人机编队控制原理_其他_24 强化学习无人机编队 无人机编队控制原理_预测控制_25

模型预测控制器设计

利用 MPC (Model Predictive Controller) 方法推导了制导控制器。在 MPC 设计中,以二次形式描述性能指标,并考虑到系统的约束,如碰撞避免和通信范围。

模型预测控制

强化学习无人机编队 无人机编队控制原理_其他_26

模型预测控制是一种基于模型的控制方法,它在每次考虑系统的轨迹跟踪或约束后,优化从当前时间到未来有限时间的响应。最优控制的范围随着时间的推移而减小,因此,这种方法也被称为后退范围控制。相关可参见模型预测控制介绍。

控制器设计

为了在没有任何跟踪误差的情况下跟踪参考位置设计了伺服系统。扩充状态方程如下 强化学习无人机编队 无人机编队控制原理_模型预测_27

接下来在多架直升机的飞行中设置约束,即通信约束和碰撞约束。

  • 通信约束。当通过改变 强化学习无人机编队 无人机编队控制原理_模型预测_28 来改变队形时。考虑到每架直升机的通信距离,即 强化学习无人机编队 无人机编队控制原理_无人机_29强化学习无人机编队 无人机编队控制原理_无人机_30,设置以下约束条件以限制第 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_05 个 follower 的位置,强化学习无人机编队 无人机编队控制原理_预测控制_32
  • 进而设置的惩罚函数为 强化学习无人机编队 无人机编队控制原理_其他_33 此处 强化学习无人机编队 无人机编队控制原理_模型预测_34强化学习无人机编队 无人机编队控制原理_模型预测_35强化学习无人机编队 无人机编队控制原理_预测控制_36。当 强化学习无人机编队 无人机编队控制原理_预测控制_37强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_38是最优轨迹。
  • 碰撞约束。在第 强化学习无人机编队 无人机编队控制原理_强化学习无人机编队_05 个飞行器处增加人工势函数 强化学习无人机编队 无人机编队控制原理_其他_40
    此处,强化学习无人机编队 无人机编队控制原理_预测控制_41强化学习无人机编队 无人机编队控制原理_预测控制_42强化学习无人机编队 无人机编队控制原理_预测控制_43

在此约束基础上,进而得到最优实时控制。