news 2026/6/4 11:38:25

【信息科学与工程学】【物理/化学和工程科学】【数学分析】第一百九十九篇 矢量分析和场论及高温合金——低空经济02

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【信息科学与工程学】【物理/化学和工程科学】【数学分析】第一百九十九篇 矢量分析和场论及高温合金——低空经济02

编号

类型

领域

理论

方法的逐步推理思考的数学表达式(涵盖数学物理/数学化学的数学表达式及数字/数值)和完整的求解过程和求解方程

参数列表和参数说明和参数表达

关联知识

331

数学模型

低空飞行/协同控制

多智能体强化学习

集中式训练分布式执行:每个智能体(飞行器)的观测矢量 oi​输入到其策略网络 $\pi_i(\mathbf{a}_i

\mathbf{o}i; \boldsymbol{\theta}i)输出动作\mathbf{a}i。全局奖励R_t由所有智能体共同获得。价值网络V(\mathbf{o}1, ..., \mathbf{o}N; \phi)评估全局状态价值。通过策略梯度\nabla{\boldsymbol{\theta}i} J \approx E[ \nabla{\boldsymbol{\theta}i} \log \pi_i(\mathbf{a}i

\mathbf{o}i) A_t ]更新,优势函数A_t = R_t + \gamma V(\mathbf{o}{t+1}) - V(\mathbf{o}_t)$。用于训练多无人机协同任务(如包围、搜索)。

332

数学模型

低空飞行/控制

气动参数在线辨识

递推最小二乘法:飞行器动力学模型线性化为 y=Φθ+e, 其中 y为测量输出(如加速度、角加速度),Φ为回归矩阵(由状态、控制输入构成),θ为待辨识参数矢量(如气动导数)。递推公式:θ^k​=θ^k−1​+Kk​(yk​−Φk​θ^k−1​), Kk​=Pk−1​ΦkT​(R+Φk​Pk−1​ΦkT​)−1, Pk​=(I−Kk​Φk​)Pk−1​+Q。用于自适应控制。

y:测量输出矢量。
Φ:回归矩阵,由飞行状态和控制输入构成。
θ:待辨识的气动参数矢量。
θ^k​:k时刻的参数估计值。
Kk​:增益矩阵。
Pk​:参数估计误差协方差矩阵。
Q,R:过程噪声和测量噪声协方差矩阵。

参数辨识、递推最小二乘、系统辨识、自适应控制、飞行力学

333

数学模型

低空飞行/任务规划

分布式凸优化

分布式梯度下降:N个智能体协同求解 minx​∑i=1N​fi​(x), 其中 fi​为局部目标函数。每个智能体维护局部变量 xi​, 通过通信与邻居交换信息,迭代更新:xi​(k+1)=∑j∈Ni​​wij​xj​(k)−α∇fi​(xi​(k)), 其中 wij​为权重,满足 ∑j​wij​=1, α为步长。在连通图下,所有 xi​收敛到共同的最优解。用于分布式任务分配、资源调度。

fi​(x):智能体 i的局部目标函数。
xi​:智能体 i的局部决策变量矢量。
Ni​:智能体 i的邻居集合。
wij​:混合权重,通常基于图拉普拉斯矩阵。
α:步长。
∇fi​:局部目标函数的梯度。
连通图:保证信息在整个网络中传播。

分布式优化、梯度下降、一致性、多智能体决策、资源分配

334

数学模型

低空飞行/控制

模仿学习

行为克隆:从专家演示数据集 D={(si​,ai​)}中学习策略 $\pi_\theta(\mathbf{a}

\mathbf{s})。最小化损失L(\theta) = \sum_i |\pi\theta(\mathbf{s}i) - \mathbf{a}_i|^2。∗∗逆强化学习∗∗:从专家轨迹\tau_E中推断奖励函数R(\mathbf{s}, \mathbf{a}; \mathbf{w})的参数\mathbf{w},使得专家策略优于其他策略。通过最大熵逆强化学习:P(\tau

\mathbf{w}) = \frac{1}{Z} \exp(R(\tau; \mathbf{w}))$, 最大化专家轨迹的似然。然后利用学到的奖励函数进行强化学习。

335

数学模型

低空飞行/监控

意图识别

隐马尔可夫模型:隐藏状态 qt​∈{1,...,K}表示目标意图,观测 ot​为测量矢量(如位置、速度)。模型参数 λ=(A,B,π), 其中 A为状态转移矩阵,B为观测概率矩阵,π为初始状态分布。给定观测序列 O1:T​, 用 Viterbi 算法解码最可能的意图序列 $\mathbf{q}{1:T}^* = \arg\max{\mathbf{q}} P(\mathbf{q}_{1:T}

\mathbf{O}_{1:T}, \lambda)$。可结合交互式多模型(IMM)跟踪多个可能的意图。

qt​:时刻 t的隐藏意图状态。
ot​:时刻 t的观测矢量。
A:状态转移概率矩阵,$A{ij} = P(q{t+1}=j

336

数学模型

低空飞行/通信

智能反射表面

可重构智能表面信道:IRS 由 N个可调反射单元组成,反射系数 v=[ejϕ1​,...,ejϕN​]T。基站到用户信道 h=HRIH​diag(v)hBR​+hBU​。优化 v以最大化信噪比 $\text{SNR} =

\mathbf{h}^H \mathbf{w}

^2 / \sigma^2,其中\mathbf{w}为基站波束赋形矢量。联合优化\mathbf{w}和\mathbf{v},受限于

337

数学模型

低空飞行/导航

语义 SLAM

联合优化:状态变量包含相机位姿 xc​和语义地标 ls​(如物体中心、方向)。观测包含特征点 zp​和物体检测框 zb​。后端优化最小化误差:∑∥zp​−πp​(xc​,lp​)∥2+∑∥zb​−πb​(xc​,ls​)∥2, 其中 πb​为物体投影模型。语义信息提供数据关联的鲁棒性(如通过物体类别)和高级理解。

xc​:相机位姿矢量(位置、姿态)。
ls​,lp​:语义地标(物体)和特征点的三维位置矢量。
zp​,zb​:特征点和物体检测框的观测矢量。
πp​,πb​:特征点和物体的投影函数,将三维点映射到图像。
联合优化:同时优化位姿、特征点、语义地标。
物体检测:提供语义观测,如边界框、类别、位姿。

语义SLAM、物体级地图、联合优化、目标检测、场景理解

338

数学模型

低空飞行/通信

博弈论功率控制

非合作博弈:N个用户(飞行器)竞争信道,用户 i选择发射功率 pi​最大化自身效用 ui​(pi​,p−i​)=log(1+∑j=i​pj​hij​+σ2pi​hii​​)−cpi​, 其中 c为功率代价。纳什均衡满足对每个 i, pi∗​=argmaxpi​​ui​(pi​,p−i∗​)。分布式迭代算法:pi(k+1)​=[c1​−hii​∑j=i​pj(k)​hij​+σ2​]+​。

pi​:用户 i的发射功率。
p−i​:除用户 i外其他用户的功率矢量。
hij​:从用户 j到用户 i的接收端的信道增益。
ui​:用户 i的效用函数,权衡速率和功耗。
c:功率代价系数。
纳什均衡:任何用户单方面改变策略都不能提高自身效用。
[x]+​:max(x,0)。

博弈论、功率控制、非合作博弈、纳什均衡、分布式算法

339

数学模型

低空飞行/控制

自适应容错控制

滑模观测器:x^˙=Ax^+Bu+L(y−y^​)+ν, y^​=Cx^, ν为不连续项用于估计故障。故障估计 f^=ρsgn(ey​), 其中 ey​=y−y^​。控制器 u=unom​−B+f^补偿故障。需满足匹配条件:故障在 B的列空间内。

x^:状态估计矢量。
y,y^​:测量输出和估计输出矢量。
ν:滑模观测器的不连续注入项。
f^:故障估计矢量(如执行器失效、卡死)。
ρ:滑模增益,大于故障上界。
unom​:标称控制律。
B+:控制矩阵的伪逆,用于故障补偿。

容错控制、滑模观测器、故障估计、故障补偿、鲁棒控制

340

数学模型

低空飞行/路径规划

快速轨迹生成

最小加加速度轨迹:在三维空间生成时间最优的平滑轨迹,约束速度 vmax​、加速度 amax​、加加速度 jmax​。将路径离散为 M个航点 pk​, 用 B 样条表示轨迹 r(t)=∑pi​Bi​(t)。优化问题:mint1​,...,tM​​T+λ∫∥r′′′(t)∥2dt, 约束 ∥r′(t)∥≤vmax​, ∥r′′(t)∥≤amax​, ∥r′′′(t)∥≤jmax​。转化为凸优化(如二次规划)求解。

pk​:控制点位置矢量。
Bi​(t):B 样条基函数。
T:总时间。
λ:光滑性权重。
vmax​,amax​,jmax​:最大速度、加速度、加加速度矢量约束。
加加速度:加速度的导数,影响乘坐舒适性和执行器带宽。
凸优化:可高效求解全局最优解。

轨迹优化、B样条、凸优化、微分平坦、时间最优

341

数学模型

低空飞行/机器学习

元学习

模型无关元学习:学习一个可快速适应新任务的初始化参数 θ。在元训练阶段,从任务分布 p(T)中采样任务 Ti​, 每个任务有支持集 Disup​和查询集 Diquery​。内层适应:用支持集计算适应后参数 θi′​=θ−α∇θ​LTi​​(fθ​,Disup​)。外层更新:用查询集损失 ∑i​LTi​​(fθi′​​,Diquery​)更新 θ。

θ:元学习器(如神经网络)的初始参数。
Ti​:第 i个任务,如一种新的障碍物环境。
Disup​,Diquery​:任务 i的支持集和查询集。
θi′​:任务 i的适应后参数。
α:内层学习率。
LTi​​:任务 i的损失函数。
任务分布:元训练任务应覆盖元测试时可能遇到的任务。

元学习、小样本学习、MAML、任务适应、快速学习

342

数学模型

低空飞行/仿真

多保真度优化

协同克里金模型:融合高保真(精确但耗时)模型 fh​(x)和低保真(快速但粗糙)模型 fl​(x)。假设 fh​(x)=ρfl​(x)+δ(x), 其中 ρ为缩放因子,δ为差异过程,建模为高斯过程。用少量高保真样本和较多低保真样本训练协同克里金模型 f^​h​(x)。用于飞行器设计优化,在优化循环中用 f^​h​代理高保真仿真。

x:设计变量矢量。
fh​,fl​:高保真和低保真模型输出。
ρ:标量,关联两种模型。
δ(x):高斯过程,建模两种模型间的差异。
f^​h​(x):融合后的协同克里金预测模型。
高斯过程:用均值和协方差函数描述空间相关随机场。
代理模型:近似计算昂贵的真实模型,用于优化。

多保真度建模、协同克里金、代理模型、设计优化、计算效率

343

数学模型

低空飞行/监控

数字孪生预测

物理信息神经网络:在数字孪生中,用神经网络 u(x,t;θ)近似物理场(如流场、温度场)。损失函数包含数据项 Ldata​=∑∥u(xi​,ti​)−ui​∥2和物理项 Lphy​=∑∥N[u](xj​,tj​)∥2, 其中 N为控制偏微分方程算子(如纳维-斯托克斯)。通过训练网络预测未来状态,用于飞行器在复杂环境中的性能预测。

u(x,t;θ):物理场近似神经网络,输入为空间坐标 x和时间 t, 参数 θ。
Ldata​:与测量数据匹配的损失项。
Lphy​:与物理定律匹配的损失项,残差为零。
N:偏微分方程算子,如 N[u]=∂t∂u​+(u⋅∇)u−ν∇2u+∇p。
PINN:物理信息神经网络,将物理规律编码为损失函数约束。

数字孪生、物理信息神经网络、偏微分方程、流场预测、实时仿真

344

数学模型

低空飞行/协同

集群涌现控制

Vicsek模型:N个自驱动粒子(飞行器),位置 ri​, 速度方向 θi​。更新规则:θi​(t+Δt)=⟨θj​(t)⟩j∈Ni​​+ηξi​(t), 其中 ⟨⋅⟩表示邻居平均方向,η为噪声幅度,ξi​为随机扰动。位置更新 ri​(t+Δt)=ri​(t)+v0​n^(θi​(t))Δt。在低噪声下,系统涌现出同步运动。用于模拟和设计无人机集群的群体行为。

ri​:粒子 i的位置矢量。
θi​:粒子 i的速度方向角。
Ni​:粒子 i的邻居集合(距离小于 R)。
⟨θj​⟩:邻居方向角的平均。
η:噪声强度。
ξi​(t):[−π,π]上的均匀随机噪声。
v0​:粒子恒定速度大小。
n^(θ):方向角 θ对应的单位矢量。

群体智能、自组织、Vicsek模型、同步、集群控制

345

数学模型

低空飞行/通信

无人机基站部署

覆盖最大化:无人机作为空中基站,位置 r, 高度 h。地面用户 k的接收功率 Pk​=Pt​Gt​Gr​/Lk​, 路径损耗 Lk​=Lfs​+ηNLOS​, 视距概率 PLOS​(θk​)=1/(1+ae−b(θk​−a)), θk​为仰角。优化问题:maxr,h​∑k​I(SINRk​≥γ), 其中 SINRk​=Pk​/(Ik​+σ2)。可用遗传算法或梯度法求解。

r,h:无人机基站的水平位置矢量和高度。
Pt​:发射功率。
Gt​,Gr​:发射和接收天线增益。
Lk​:到用户 k的路径损耗。
θk​:仰角,θk​=arctan(h/∥r−uk​∥)。
PLOS​:视距概率,取决于环境。
I(⋅):指示函数,条件满足为1,否则0。
γ:信干噪比阈值。

无人机基站、覆盖优化、路径损耗模型、视距概率、资源分配

346

数学模型

低空飞行/感知

偏振成像

斯托克斯矢量:描述光的偏振状态,S=[I,Q,U,V]T, 其中 I为总强度,Q为水平与垂直偏振强度差,U为 +45∘与 −45∘偏振差,V为右旋与左旋圆偏振差。由多个偏振方向图像计算。用于材料分类、去雾、目标增强。例如,金属和电介质表面的偏振特性不同,可用于检测伪装目标。

S:斯托克斯矢量,描述光束的偏振状态。
I,Q,U,V:斯托克斯参数,I2≥Q2+U2+V2。
偏振度:DoP=Q2+U2+V2​/I。
偏振角:α=21​arctan(U/Q)。
偏振成像:获取每个像素的斯托克斯矢量。
材料分类:利用不同材料的偏振特性差异。

偏振光学、斯托克斯矢量、偏振度、目标检测、材料识别

347

数学模型

低空飞行/控制

迭代学习控制

更新律:针对重复性任务(如周期性巡检),利用前一次执行的经验修正当前周期的控制输入。设 k为迭代次数,t为时间。控制律 uk+1​(t)=uk​(t)+Lek​(t+1), 其中 ek​(t)=yd​(t)−yk​(t)为跟踪误差,L为学习增益矩阵。收敛条件:∥I−PL∥<1, 其中 P为系统脉冲响应矩阵。用于提高轨迹跟踪精度。

uk​(t):第 k次迭代在时刻 t的控制输入。
yk​(t),yd​(t):第 k次迭代的输出和期望输出。
ek​(t):跟踪误差。
L:学习增益矩阵(可时变)。
迭代收敛:随着迭代次数增加,误差趋近于零。
重复性任务:每个迭代周期执行相同的期望轨迹。

迭代学习控制、重复控制、学习增益、收敛条件、轨迹跟踪

348

数学模型

低空飞行/路径规划

基于采样的动力学规划

RRT*:在 RRT 基础上,通过重布线优化路径代价。扩展新节点 xnew​后,在其附近邻域 Xnear​内寻找使从 xinit​到 xnew​代价更小的父节点,并重布线邻域内其他节点,检查以 xnew​为父节点是否能降低其代价。代价函数 c(x,x′)考虑控制努力、时间等。在概率完备性基础上渐进最优。

xnew​:新生成的节点。
Xnear​:xnew​的邻域节点集合,通常以半径为 r的球定义。
c(x,x′):从节点 x到 x′的代价,通常为控制输入积分或时间。
重布线:为邻域内节点重新选择父节点,如果新路径代价更低。
渐进最优:随着采样点增加,解的成本以概率1收敛到最优。

运动规划、RRT*、渐进最优、重布线、基于采样

349

数学模型

低空飞行/监控

分布式假设检验

共识+创新:每个节点有局部观测 zi​, 假设 H0​和 H1​。节点计算局部对数似然比 $L_i = \log \frac{p(\mathbf{z}_i

H_1)}{p(\mathbf{z}_i

H_0)}。分布式更新:\lambda_i(t+1) = \sum{j \in N_i} w{ij} \lambda_j(t) + \gamma (L_i - \lambda_i(t)),其中\lambda_i为局部决策统计量,\gamma为步长。当\lambda_i$ 超过阈值,则做出决策。用于分布式检测事件(如非法入侵)。

350

数学模型

低空飞行/通信

可重构智能表面辅助定位

定位CRB:目标位置 η=[x,y,z]T, 测量矢量 z(如TOA、AOA、RSS), 其费雪信息矩阵 $J(\boldsymbol{\eta}) = E[ (\frac{\partial \ln p(\mathbf{z}

\boldsymbol{\eta})}{\partial \boldsymbol{\eta}}) (\frac{\partial \ln p(\mathbf{z}

\boldsymbol{\eta})}{\partial \boldsymbol{\eta}})^T ]。位置估计误差协方差满足C \ge J^{-1}。通过优化RIS相位\mathbf{v}最大化J$ 的某个标量函数(如迹、行列式),以提高定位精度。

351

数学模型

低空飞行/控制

事件触发控制

触发条件:不连续地更新控制输入,仅在满足触发条件时进行。定义误差 e(t)=x^(t)−x(t), 其中 x^为上次触发时的状态。触发条件 ∥e(t)∥≥σ∥x(t)∥或基于 Lyapunov 函数变化。控制律 u(t)=Kx^(tk​), t∈[tk​,tk+1​)。可减少通信或计算负担。

x(t):当前状态矢量。
x^(t):在最近触发时刻 tk​采样的状态矢量。
e(t):状态误差矢量,e(t)=x^(t)−x(t)。
σ:触发阈值参数,σ>0。
tk​:第 k次触发时刻。
事件触发:仅在需要时更新控制,减少不必要的更新。
K:状态反馈增益矩阵。

事件触发控制、采样控制、资源节约、网络化控制系统

352

数学模型

低空飞行/监控

生成对抗网络异常检测

GAN训练:生成器 G(z;θg​)从噪声 z生成数据,判别器 D(x;θd​)判断输入 x来自真实数据还是生成器。对抗训练:minG​maxD​V(D,G)=Ex∼pdata​​[logD(x)]+Ez∼pz​​[log(1−D(G(z)))]。
异常检测:训练 GAN 仅用正常数据。测试时,计算重构误差 ∥x−G(z∗)∥, 其中 z∗=argminz​∥x−G(z)∥2。误差大则判定为异常。

G,D:生成器和判别器神经网络,参数为 θg​,θd​。
z:噪声输入矢量,通常来自简单分布(如高斯分布)。
pdata​,pz​:真实数据分布和噪声分布。
V(D,G):价值函数,判别器试图最大化,生成器试图最小化。
重构误差:测试数据与生成器重构数据之间的差异。
异常分数:基于重构误差定义,用于检测异常。

生成对抗网络、异常检测、无监督学习、重构误差、数据生成

353

数学模型

低空飞行/通信

非正交多址接入

功率域 NOMA:基站向多个用户发送叠加信号 x=∑k=1K​pk​​sk​, 其中 pk​为功率分配,sk​为用户 k的数据流。接收信号 yk​=hkT​x+nk​。用户采用连续干扰消除:先解码强用户信号,减去后再解码自身信号。优化功率分配 p=[p1​,...,pK​]T以最大化和速率或保证公平性。

x:基站发射信号矢量。
pk​:分配给用户 k的功率。
sk​:用户 k的数据符号矢量。
hk​:基站到用户 k的信道矢量。
yk​:用户 k的接收信号。
SIC:连续干扰消除,按信道增益强弱顺序解码和消除干扰。
和速率:所有用户速率之和,∑k​log(1+SINRk​)。

非正交多址接入、功率分配、连续干扰消除、多用户通信、和速率优化

354

数学模型

低空飞行/协同

任务分配

匈牙利算法:分配 N个任务给 N个智能体,代价矩阵 C, 元素 cij​为智能体 i执行任务 j的代价。寻找置换 π最小化总代价 ∑i​ci,π(i)​。步骤:1) 行归约、列归约;2) 用最少数目的线覆盖所有零元素;3) 若线数小于 N, 调整矩阵,返回步骤2;4) 从零元素中确定最优分配。复杂度 O(N3)。

C:代价矩阵,C∈RN×N。
cij​:智能体 i执行任务 j的代价。
π:分配方案,一个置换,π(i)表示分配给智能体 i的任务。
行归约:每行减去该行最小值。
列归约:每列减去该列最小值。
覆盖线:用水平或垂直线覆盖矩阵中的所有零。
最优分配:总代价最小的完美匹配。

任务分配、匈牙利算法、组合优化、指派问题、多智能体

355

数学模型

低空飞行/控制

预设性能控制

性能函数:定义误差 e(t)的包络 e(t)需满足 −ρi​(t)<ei​(t)<ρi​(t), 其中 ρi​(t)=(ρi0​−ρi∞​)e−li​t+ρi∞​为预设性能函数,ρi0​>ρi∞​>0, li​>0。引入变换 z=T(e,ρ), 例如 zi​=21​log(1−ei​/ρi​ei​/ρi​+1​)。设计控制器使 z稳定,则 e自动满足预设性能。

e(t):跟踪误差矢量。
ρi​(t):第 i个误差分量的预设性能函数,控制瞬态和稳态边界。
ρi0​,ρi∞​,li​:性能函数参数,初始值、稳态值、收敛速率。
z:变换后的误差矢量,无约束。
T(⋅):变换函数,将受限误差映射到无约束空间。
预设性能:预先指定误差的收敛速度、超调量和稳态精度。

预设性能控制、误差变换、瞬态性能、约束控制、鲁棒控制

356

数学模型

低空飞行/导航

多普勒速度日志

声学多普勒计程仪:向海底发射多个波束,测量回波的多普勒频移。波束方向单位矢量 k^i​, 测量频移 fd,i​=λ2​(v−vc​)⋅k^i​, 其中 v为飞行器速度,vc​为海流速度。至少三个非共面波束可解算 v−vc​。结合姿态信息转换到导航坐标系,积分得到相对位移,用于水下或近水面导航。

k^i​:第 i个声波束在载体坐标系中的单位方向矢量。
fd,i​:第 i个波束测量的多普勒频移。
v:飞行器相对于海底的速度矢量。
vc​:海流速度矢量(假设在测量周期内恒定)。
λ:声波波长。
DVL:多普勒速度日志,提供对地速度矢量。
波束几何:通常配置 Janus 配置(四个波束,两两对称)。

多普勒计程仪、水下导航、速度测量、波束形成、相对位移

357

数学模型

低空飞行/监控

时空背景建模

高斯混合模型:每个像素的颜色值 xt​用 K个高斯分布建模:p(xt​)=∑k=1K​wk,t​N(xt​;μk,t​,Σk,t​)。在线更新:对每个新像素,计算与现有高斯的匹配,若匹配(如马氏距离小于阈值),则更新该高斯的参数:wk,t​=(1−α)wk,t−1​+α, μk,t​=(1−ρ)μk,t−1​+ρxt​, Σk,t​=(1−ρ)Σk,t−1​+ρ(xt​−μk,t​)(xt​−μk,t​)T。否则创建新高斯。前景检测:若像素不与任何背景高斯匹配则为前景。

xt​:时刻 t的像素颜色矢量(如 RGB)。
wk,t​:第 k个高斯分量的权重。
μk,t​,Σk,t​:第 k个高斯分量的均值和协方差矩阵。
K:高斯分量个数,通常 3-5。
α:学习率,控制背景模型更新速度。
ρ:参数更新率,ρ=αη(xt​;μk​,Σk​)。
前景/背景:根据像素与背景模型的匹配程度判断。

背景减除、高斯混合模型、运动检测、视频监控、在线学习

358

数学模型

低空飞行/通信

全双工通信

自干扰消除:全双工节点同时同频收发,接收信号 y(t)=hs​xs​(t)+hSI​xSI​(t)+n(t), 其中 hSI​xSI​为自干扰。通过模拟域、数字域抵消。模拟域:估计信道 hSI​, 生成抵消信号 −h^SI​xSI​。数字域:进一步消除残留干扰。自干扰信道估计可用已知的发射信号 xSI​训练。剩余自干扰功率决定全双工增益。

y(t):接收信号。
hs​,xs​(t):期望信号的复信道增益和发射信号。
hSI​,xSI​(t):自干扰信道的复增益和自身发射信号。
n(t):噪声。
h^SI​:自干扰信道的估计值。
自干扰消除:在模拟和数字域减去估计的自干扰信号。
全双工增益:理论上比半双工频谱效率提高一倍,实际受限于消除能力。

全双工通信、自干扰消除、信道估计、同时同频收发、频谱效率

359

数学模型

低空飞行/制导

强化学习制导

深度 Q 网络:状态 s包含相对位置、速度等,动作 a为离散的加速度方向。Q 网络 Q(s,a;θ)近似动作价值函数。训练目标:y=r+γmaxa′​Q(s′,a′;θ−), 损失 L(θ)=E[(y−Q(s,a;θ))2]。用经验回放和固定目标网络稳定训练。训练后,制导策略 π(s)=argmaxa​Q(s,a)。

s,a:状态矢量和动作矢量。
Q(s,a;θ):动作价值函数,参数为 θ的神经网络近似。
r:立即奖励,如基于脱靶量或控制努力。
γ:折扣因子。
y:目标 Q 值,结合奖励和下一状态的最大 Q 值。
θ−:目标网络参数,定期从主网络复制。
经验回放:存储转移 (s,a,r,s′)在缓冲池中,随机采样训练。

深度强化学习、DQN、价值函数、经验回放、制导策略

360

数学模型

低空飞行/协同

同步定位与建图

分布式 SLAM:多个智能体各自建图,通过相遇或通信交换信息,融合成一致地图。关键挑战是数据关联和相对位姿估计。可用分布式优化方法,如分布式 Gauss-Seidel:每个智能体优化自身变量(位姿、地标),固定邻居变量,交替进行。全局代价函数分解为局部代价之和,通过一致性约束关联。

xi​:智能体 i的变量(位姿、观测到的地标)。
fi​(xi​):智能体 i的局部代价函数,基于其自身的观测。
fij​(xi​,xj​):智能体 i和 j之间的约束代价,来自共同观测或相对测量。
分布式优化:每个智能体只优化自身变量,通过通信协商达成全局一致。
地图融合:将局部地图对齐到全局坐标系。
数据关联:识别不同智能体观测到的同一地标。

分布式 SLAM、多机器人 SLAM、地图融合、分布式优化、协同感知

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 11:36:01

WechatDecrypt:轻松解锁你的微信聊天记录

WechatDecrypt&#xff1a;轻松解锁你的微信聊天记录 【免费下载链接】WechatDecrypt 微信消息解密工具 项目地址: https://gitcode.com/gh_mirrors/we/WechatDecrypt 你是否曾因为更换手机而丢失重要的聊天记录&#xff1f;或者需要查找几个月前的某个重要信息&#xf…

作者头像 李华
网站建设 2026/6/4 11:34:15

Mac Mouse Fix终极指南:如何将普通鼠标打造成Mac生产力神器

Mac Mouse Fix终极指南&#xff1a;如何将普通鼠标打造成Mac生产力神器 【免费下载链接】mac-mouse-fix Mac Mouse Fix - Make Your $10 Mouse Better Than an Apple Trackpad! 项目地址: https://gitcode.com/GitHub_Trending/ma/mac-mouse-fix Mac Mouse Fix是一款革命…

作者头像 李华
网站建设 2026/6/4 11:31:29

颠覆性虚拟显示技术:ParsecVDD如何重新定义Windows多屏体验

颠覆性虚拟显示技术&#xff1a;ParsecVDD如何重新定义Windows多屏体验 【免费下载链接】parsec-vdd ✨ Perfect virtual display for game streaming 项目地址: https://gitcode.com/gh_mirrors/pa/parsec-vdd 想象一下&#xff0c;凌晨3点&#xff0c;你正在远程调试一…

作者头像 李华
网站建设 2026/6/4 11:30:06

OpenCore Legacy Patcher终极指南:5步让老旧Mac焕发新生

OpenCore Legacy Patcher终极指南&#xff1a;5步让老旧Mac焕发新生 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher OpenCore Legacy Patcher是一款强大的开源…

作者头像 李华
网站建设 2026/6/4 11:30:00

YOLO txt 格式转换为COCO Json 格式

将数据集YOLO txt格式转换为 COCO Json格式在下面的脚本中&#xff1a;要注意YOLO训练集的图片目录和标签目标classes.txt文件就是YOLO数据集中的类别&#xff0c;直接写在txt文件中&#xff0c;一行一个&#xff0c;不用带引号和逗号。以及生成的训练集json文件和测试集json文…

作者头像 李华
网站建设 2026/6/4 11:29:04

终极指南:SMUDebugTool专业硬件调试工具完整教程

终极指南&#xff1a;SMUDebugTool专业硬件调试工具完整教程 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcode…

作者头像 李华