1. 隐式神经表示(INR)技术概述
隐式神经表示(Implicit Neural Representation, INR)是近年来计算机视觉和无线感知领域的一项突破性技术。与传统的显式图像表示不同,INR通过神经网络参数化场景的连续函数表示,将离散的像素信息映射为连续空间中的隐式场。这种表示方式具有几个显著优势:
首先,INR突破了传统成像方法的分辨率限制。在常规成像系统中,图像质量受限于采样定理和硬件参数(如传感器像素密度)。而INR通过神经网络的插值能力,可以实现超分辨率重建。例如,在无线感知场景中,即使信道状态信息(CSI)的采样点数有限,INR仍能重建出细节丰富的图像。
其次,INR具有连续表示的特性。传统方法需要预先确定离散网格的分辨率,而INR可以在任意空间位置查询图像值。这一特性在三维成像中尤为重要,使得INR能够生成任意精度的体素表示,如图13(e)所示的分辨率达到λ/20的渲染效果。
从技术实现角度看,典型的INR架构包含以下几个核心组件:
- 位置编码层:将输入坐标映射到高维空间,以捕捉高频信号特征。实验中采用256维的位置编码(Npe=256)
- 多层感知机(MLP):通常5-8层,使用正弦激活函数(sin)而非ReLU,后者在实验中表现较差(PSNR仅6.04dB)
- 物理模型约束:通过前向传播模型指导网络优化,确保重建结果符合电磁波传播规律
关键提示:INR的性能高度依赖于激活函数的选择。实验数据表明,sin激活的PSNR达到27.41dB,而ReLU仅6.05dB(表II)。这是因为sin函数能更好地保留高频信息。
2. 多路径干扰下的成像增强
2.1 多路径干扰的形成机制
在实际无线环境中,信号传播会经历直射、反射、绕射等多种路径。如图2(a)所示的典型RIS辅助系统,多路径干扰主要来自:
- TX-背景散射体-RX路径
- TX-背景散射体-RIS-RX路径
- TX-背景散射体-ROI-RX路径
这些路径会在接收端产生叠加干扰,表现为信道矩阵中的Hothers,k项。当干扰能量较大时,传统成像方法的性能会急剧恶化。如表V所示,当TX位置误差达到λ/2时,重建图像已出现严重失真。
2.2 两阶段干扰抑制策略
2.2.1 背景校准技术
我们提出先进行背景校准的预处理步骤:
- 在无目标状态下测量ROI无关信道Hbg
- 在实际成像时从测量值Hsen,k中减去背景成分
- 通过多次测量平均降低校准噪声Nima
数学上,残差信道表示为:
Hima,k = Hroi-bg + (Htx-roi-rx + Htx-roi-ris-rx,k + Htx-ris-roi-rx,k)其中Hroi-bg代表ROI与背景的耦合干扰,仍是未知项。
2.2.2 联合学习成像与干扰
针对残余干扰Hroi-bg,我们将其建模为可学习参数A:
vec(Hroi-bg) = Aσ优化问题重构为:
minθ,A μ(f'(Mθ(G°),Ω,A),y) + ρ(Mθ(G°))通过联合优化图像表示Mθ和干扰矩阵A,系统在SIR>0dB时仍能保持良好性能(图14)。相比传统方法需要SIR>20dB,这是一个显著提升。
实测技巧:背景校准需保证环境静止。建议在系统部署时预留专门校准时段,并通过10次以上测量平均将噪声降低3-5dB。
3. 动态目标成像的实时化方案
3.1 时序相关性利用
动态场景中,相邻时刻的图像具有强相关性。假设t-1时刻的图像表示为Mθt-1,则在t时刻采用先验嵌入的优化目标:
θt* = argminθt μ(f(Mθt(G°),Ω),y; Mθt-1)这种方法的优势体现在:
- 训练epoch从5000减少到200,耗时从27s降至1.1s(表VI)
- 相同epoch下PSNR提升约8dB(图15)
- 达到相同SSIM所需的epoch减少6-8倍
3.2 实现细节与参数选择
在实际部署时需注意:
- 学习率调度:初始设为10^-3,50epoch无改善则减半
- 早停机制:连续200epoch无提升则终止训练
- 梯度裁剪:限制梯度范数≤2避免发散
- 稀疏约束:系数α=0.01平衡重建质量与稳定性(表III)
硬件配置建议:
- GPU:NVIDIA 4090及以上
- 内存:≥32GB
- 框架:PyTorch+CUDA加速
4. 系统级性能验证
4.1 实验配置
我们构建了3GHz频段的仿真系统:
- RIS:50×50单元,总面积2.5m×2.5m
- 天线阵列:8发8收ULA,增益4dBi
- 噪声功率:-110dBm
- ROI:2m×2m区域,离散为100×100像素
数据集采用TikTok舞蹈视频提取的2615张人体分割图,归一化到[0,4πA²/λ²]模拟RCS。
4.2 关键性能指标
- 分辨率突破:传统衍射极限为λ/2,而INR实现λ/5甚至λ/20分辨率(图13)
- 抗噪能力:在Pn<-80dBm时SSIM保持>0.9(图12)
- 距离适应性:存在最优成像距离D0,K=40时D0≈30λ(图9)
- 训练效率:200epoch即可获得可用结果,耗时约1秒(表II)
4.3 与传统方法对比
如表IV所示,在K=500测量下:
- INR的MSE为0.0012,而CS算法需2500次测量仍只有0.2485
- SSIM指标从CS的0.1296提升至0.9889
- 可支持超分辨率重建(ξv=λ/5 vs CS的λ)
5. 典型问题排查指南
5.1 图像模糊或失真
可能原因:
- 激活函数选择不当→改用sin激活
- 位置编码缺失→增加Npe=256编码
- 学习率过高→采用动态调整策略
5.2 训练不收敛
检查清单:
- 梯度爆炸→启用梯度裁剪
- 局部最优→加入稀疏约束(α=0.01)
- 数据问题→验证CSI测量有效性
5.3 实时性不足
优化建议:
- 采用先验嵌入减少epoch
- 使用混合精度训练
- 对静态背景预存Hbg矩阵
6. 进阶应用:通信成像一体化
6.1 通信用户位于ROI内
当用户持手机在成像区域内时(图2a),系统可:
- 通过INR重建人体图像
- 用手部检测NN定位设备
- 优化RIS相位提升SE:
SE(ω) = log2(1 + Pt||hcom(ω)||²/σ²)实测显示该方法比传统波束扫描快3-5倍。
6.2 通信用户位于ROI外
对于外部用户(图2b),系统通过成像表征多径:
hcom(ω) = gcomgris[Htx-risdiag(h1)+H1diag(hris-ue)]ω + htx-ue + htx-roi-ue其中H1=Htx-roidiag(σ)Hroi-ris。通过准确建模ROI散射,SE可提升2-3dB。