2023年IEEE TITS SCI2区TOP，增强遗传算法+分布式随机多无人机协同区域搜索路径规划，深度解析+性能实测-编程实验室

1.摘要

针对多无人机协同区域搜索中因协作不足导致的搜索效率低下问题，本文提出了一种基于分布式模型预测控制的实时路径规划算法。算法在有限时域内构建整体搜索目标函数，综合考虑重复搜索抑制、无人机间连通性维护以及碰撞规避等因素，并将其分解为分布式约束优化问题，使各无人机通过与邻近无人机的信息交互实现对全局搜索目标的协同优化。为克服现有算法易陷入局部最优的缺陷，本文设计了一种基于增强遗传算法的分布式随机算法，引入点交叉算子和任意时局部搜索机制以提升解的质量与稳定性。

2.系统模型与认知地图更新

本文对多无人机协同搜索的系统模型进行简化建模，将搜索区域离散为规则网格，并以网格中心表示空间位置；同时将无人机抽象为在恒定高度飞行的二维质点，其运动由位置、航向角及相应控制输入描述，为后续认知信息更新与协同搜索规划提供基础模型。运行学模型：

{ φ i ( k + 1 ) = φ i ( k ) + Δ φ i ( k ) μ i ( k + 1 ) = μ i ( k ) + v i ( k ) [ cos ⁡ ( φ i ( k + 1 ) , sin ⁡ ( φ i ( k + 1 ) ) ] T \begin{cases}\varphi_i(k+1)=\varphi_i(k)+\Delta\varphi_i(k)\\\boldsymbol{\mu}_i(k+1)=\boldsymbol{\mu}_i(k)+v_i(k)\left[\cos(\varphi_i(k+1),\sin(\varphi_i(k+1))\right]^\mathrm{T}&\end{cases}{φi(k+1)=φi(k)+Δφi(k)μi(k+1)=μi(k)+vi(k)[cos(φi(k+1),sin(φi(k+1))]T

传感器模型中，每架无人机搭载覆盖半径为R s R_sRs的圆形探测传感器，具有一定的探测概率和虚警概率，被覆盖网格单元在单一时刻仅被探测一次，并通过贝叶斯更新规则对目标存在概率进行动态更新。通信模型中，仅考虑有限通信距离的约束，假设通信无带宽限制、无时延且不受中断影响，邻居无人机集合由通信半径内的无人机确定。

多无人机通过贝叶斯更新与对数变换维护目标存在概率认知地图，并在降低计算复杂度的同时实现线性更新；随后基于一致性协议与邻居进行信息融合，保证各无人机的认知地图最终收敛并准确反映目标分布。

3.分布式模型预测控制框架与分布式约束优化

在DMPC框架下，多无人机通过OODA循环实时感知环境并进行滚动时域决策，每架无人机基于预测的有限时域状态求解局部路径优化问题，仅执行最优控制序列的首步并不断重复该过程，从而实现分布式、实时的协同搜索路径规划。

在 DMPC 框架下，多无人机局部路径规划被建模为一个 DCOP，其中每架无人机作为一个智能体，选择未来有限时域内的一条路径作为决策变量，以最小化全局代价函数：
F ( L ( k ) ) = ∑ i = 1 N v f i ( l i ( k ) ) F(L(k))=\sum_{i=1}^{N_v}f_i(l_i(k))F(L(k))=i=1∑Nvfi(li(k))

全局目标函数由环境搜索收益、飞行代价、连通性维护代价和碰撞规避代价共同构成：
F ( L ( k ) ) = γ 1 F A + γ 2 F B + F C + F D F(L(k))=\gamma_1F_A+\gamma_2F_B+F_C+F_DF(L(k))=γ1FA+γ2FB+FC+FD

其中，环境搜索收益F A F_AFA通过预测覆盖区域内单元的不确定性η i m ( k ) \eta_{im}(k)ηim(k)与数字信息素s i m ( k ) s_{im}(k)sim(k)
的加权和刻画，以兼顾探索效率与全局性；飞行代价F B F_BFB由各无人机飞行距离累加表示；连通性代价F C F_CFC基于最小生成树拓扑，对通信距离超限施加惩罚；碰撞规避代价F D F_DFD对同一时刻占据同一单元的路径赋予高惩罚。

4.DSA-EGA 算法

为求解所构建的 DCOP 模型，本文提出了分布式随机算法 DSA-EGA，将分布式随机搜索（DSA）与增强遗传算法相结合。算法以多无人机路径组合为个体，通过种群并行搜索提升解空间探索能力。针对传统基于块交叉算子的遗传操作易破坏高质量解结构的问题，DSA-EGA采用点交叉算子，在保证优良路径分配得以保留的同时促进优秀基因在种群中的传播，从而提高收敛质量。

在算法实现中，每架无人机随机生成包含N NN条路径的初始种群。适应度函数仅依赖局部信
息，由个体目标函数f i ( l i n ) f_i(l_i^n)fi(lin)与路径被选择的历史频次t i ( ⋅ ) t_i(\cdot)ti(⋅)共同决定：
f i t n = 1 − f i ( l i n ) log ⁡ t i ( a , c G A ) ∑ n ′ f i ( l i n ′ ) log ⁡ t i ( a ′ , c G A ) f_i^{tn}=1-\frac{f_i(l_i^n)\log t_i(a,c_{GA})}{\sum_{n^{\prime}}f_i(l_i^{n^{\prime}})\log t_i(a^{\prime},c_{GA})}fitn=1−∑n′fi(lin′)logti(a′,cGA)fi(lin)logti(a,cGA)

通过抑制高频解的选择概率，引导算法跳出局部最优。选择算子采用轮盘赌机制，交叉概率:
p c r o s s = log ⁡ ( m G A − c G A ) m G A p_{cross}=\frac{\log(m_{GA}-c_{GA})}{\sqrt{m_{GA}}}pcross=mGAlog(mGA−cGA)

随迭代逐渐减小变异概率：
p i , n m u t ∝ f i t n p_{i,n}^{mut}\propto f_i^{tn}pi,nmut∝fitn

为弥补 DCOP 中智能体无法判断全局最优解的不足，本文引入任意时局部搜索框架（ALS），用于在迭代过程中持续记录并传播已发现的全局最优状态。该框架基于广度优先搜索树累积和更新代价信息，不依赖额外通信，仅需各智能体增加线性存储开销，从而确保算法最终输出的是搜索过程中的最优解而非终止时解。

5.结果展示

6.参考文献

[1] Zheng J, Ding M, Sun L, et al. Distributed stochastic algorithm based on enhanced genetic algorithm for path planning of multi-UAV cooperative area search[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(8): 8290-8303.