文章着重对移动机器人路径规划和多机器人调度问题展开研究。
1.针对移动机器人路径规划问题,在蚁群算法基础上做出了巨大改进,设计了基于独狼蚁群混合算法的路径规划,算法在路径选择方向、信息素控制和路径停滞上进行的了改进和创新。
2.针对多任务下的多机器人调度,对传统的遗传算法进行了改进,在遗传算法的基础上设计了新的任务分配算法,有效减少了路径的交叉。
3.在不同的栅格地图上对算法进行了测试,进行对比验证。
在物流仓储或者自动化工厂中,搬运货物是常见的行为。移动机器人在智能化的工厂是常见的工具,这种环境下的移动机器人也称为仓储移动机器人,即自动导引车(AGV),分为有轨、无轨和新式。
机器人路径规划分为全局路径规划和局部路径规划。良好的局部路径规划可以赋予机器人更好的灵活性,但局部最优可能造成全局路径冗长;而全局路径规划追求全局范围内的最优路径,但全局最优计算量太大,全局路径规划要依赖局部路径信息。所以机器人的路径规划需要局部优化和全局优化的共同作用。蚁群算法
蚁群算法的基本数学描述可以如下:每个蚁群个体在移动时都要面临位置选择,蚂蚁个体每一步都可以基于不同的方向移动。在障碍物区域,蚂蚁个体是不能移动的。为了引导蚂蚁个体快速的寻找到目标位置,算法设置了启发式因子来引导蚁群寻找路径。
公式展示了t时刻 蚂蚁个体 k 从位置 i 移动到位置 j 的概率。信息素与启发式因子对搜索结果产生影响比重。当所有的蚂蚁完成一次探索后,各路径上的信息素进行更新。
提出计算信息素增量提出ant-cycle 、ant-quanlity和 ant-density 三种。
Q(Q>0)是常数,Q 的取值不影响算法性能,但会影响算法计算速度。Lk表示第 k 只蚂蚁在本次迭代中所探索过的路径长度,dk表示所有 k只蚂蚁在本次迭代中所探索的平均路径长度。
实际应用中,ant-cycle 模型比 ant-quanlity 模型和 ant-density模型拥有更好的性能,因为 ant-cycle 模型是基于全局的路径信息来更新信息素值,而 ant-quanlity 模型和 ant-density 模型是采用路径局部信息来更新信息素值。
改进的独狼蚁群混合算法的机器人路径规划
蚁群算法在实际中还有许多不足,例如方向选择、信息素机制、早熟问题。针对这些不足,在精英蚁群模型系统上中引入了独狼视场机制,设计了自适应调节增强函数,用来提升蚁群系统的寻径能力;同时,为了消除蚁群系统中的固有早熟停滞现象,引入了狼群算法中独狼逃跑策略,并设计了一种信息素优化机制用来提高混合算法的全局搜索能力,帮助寻径个体解决当前的路径停滞问题,避免算法陷入局部最优。
新的觅食方向选择
个体觅食方向的选择仅仅取决于当前相邻节点的位置,不利于大范围路径探索,
将蚁群算法的觅食选择方式和狼群中的视场特性相结合,利用狼群算法中的捕猎特性设计了一种新的个体觅食选择机制,将其命名为视场搜索机制,
xc 是个体下一步潜在可到达的位置,xi 是个体当前的位置,k 代表维度分量值,d 为空间距离值,xi与 xc的空间距离等于 d;visit 为一集合,存储着所有满足条件的位置,D 表示视场范围设定值;r 是个体当前位置到潜在位置的距离,v 是加权参数。
信息素更新机制的改进
为了降低蚁群群体陷入局部最优的问题,在蚁群的信息素更新机制上进行了改进,设计了一种自适应调节增强函数 e(t)。
针对算法早熟问题的优化
蚁群算法会在多次迭代后容易出现路径停滞现象,也称为早熟现象。这是由于蚁群在全局路径上信息素值分布趋于稳定,这也造成了蚂蚁个体的路径选择会趋于单一,从而造成蚁群陷入一个局部次优解现象,阻碍了蚁群进一步搜寻到潜在可能的最佳路径。
引入狼群中的独狼逃跑行特性,人工增加干扰,在蚂蚁个体视场内设定概率天敌,该天敌会以设定的概率出现。当天敌在个体视场内出现时,蚂蚁个体的视场会变大,并且个体会加速逃离原来视场的范围。
设计了合理的判断方法,该方法用来判断是否启用优化策略。
判断方法具体的思想如下:如果蚁群搜索的最优路径陷入了停滞,并且在一定迭代周期内没有变化或改善,则触发优化机制,即全局信息素优化;然后人工优化当前路径上的信息素值,从而使得陷入停滞路径上的信息素值不高于该路径周围长时间未探索位置的信息素值,最终达到帮助蚁群解决当前路径的停滞问题。
在使用该机制前,首先需要判断蚁群选择的路径是否陷入局部最优。首先对蚁群当前及其之前若干次迭代的最优路径进行抽样,该抽样函数采用斐波那契数值。
如果采样得到的值都相等,则触发设计的优化机制。该优化机制将已经形成固定最优路径上的信息素进行人工稀释,使其值低于周围位置上的信息素值,从而迫使蚁群寻找潜在的更优路径。在下一次迭代中,蚁群会主动打破旧有路径轨迹。
栅格地图仿真
可以发现改进的混合算法在局部路径搜索上由于有视场机制,搜索的路径更短,也较基本蚁群算法更灵活;改进的混合算法主动引入优化机制,避免搜索个体陷入路径停滞。在地图的尺寸较大、障碍物覆盖率较高的环境下,WAH算例的优势更明显。
多任务下多移动机器人调度
实现最优任务分配的主要困难表现在各移动体的侦查路径长度与所分配任务的分布以及各机器人路径规划的侦查路径相互影响,而各移动体侦查路径的规划问题是著名的组合优化问题,即旅行商问题(TSP)
通常用来评价任务分配质量的性能指标有下列三种:第一种是全体机器人侦查路径的总代价最小;第二种是全体机器人探测路径中最大的侦查路径代价最小;第三种是全体目标的平均侦查代价最小。
改进的多移动机器人调度算法
遗传算法在应用要具体问题时,首先需要进行编码操作。在智能仓储环境下对移动 AGV 模型的路径规划进行编码和其他遗传操作。
假设有 10 个工作站,将其编码为 0-9;另外有 5 个来完成任务的 AGV,进行随机染色体编码。
解码意义分别为:0–6--3–0、0–4--1–0、0–8--0、0–9--0、0–2--5–0,表示每个对应 AGV 从起点经过若干站点最终回到原
始点的路径信息,其中 10、11、12、13,这些数字代表虚拟分割符号。其中 0–0--0 是无效的编码。
结合强化学习思想的改进交叉概率
交叉操作产生新的个体,它的主要目的是保持群体的多样性。设计了一种新的方法来自动分配交叉概率。
强化学习中,根据环境的反馈,智能体会获得不同的奖励值用以指导下一步操作,将路径长度作为智能体的环境,而环境所反馈的信息直接影响交叉概率。
其中:常数因子用来调节概率值到方便计算的范围。n 为局部路径总数, z 为局部路径长度值, y 为各站点到启动点的路径长度。变异概率设置为Pc的1/20。
改进遗传算法
每个 AGV 要完成的任务数可以通过公式计算得出其中 n 为每个 AGV 的任务站点数,N 为总任务站点数,M 为总 AGV 数,ceil 符号为向上取整符号。
由于遗传算法的初始化是随机的,这算法的收敛变得缓慢,设计了针对遗传算法初始化设置策略。
在初始化阶段,为每个站点之间的连接路径设置了奖励值,该奖励值被用于前期 AGV 路径的引导。