隐式神经表示(INR)技术在无线感知与成像中的应用-编程实验室

1. 隐式神经表示(INR)技术概述

隐式神经表示(Implicit Neural Representation, INR)是近年来计算机视觉和无线感知领域的一项突破性技术。与传统的显式图像表示不同，INR通过神经网络参数化场景的连续函数表示，将离散的像素信息映射为连续空间中的隐式场。这种表示方式具有几个显著优势：

首先，INR突破了传统成像方法的分辨率限制。在常规成像系统中，图像质量受限于采样定理和硬件参数（如传感器像素密度）。而INR通过神经网络的插值能力，可以实现超分辨率重建。例如，在无线感知场景中，即使信道状态信息(CSI)的采样点数有限，INR仍能重建出细节丰富的图像。

其次，INR具有连续表示的特性。传统方法需要预先确定离散网格的分辨率，而INR可以在任意空间位置查询图像值。这一特性在三维成像中尤为重要，使得INR能够生成任意精度的体素表示，如图13(e)所示的分辨率达到λ/20的渲染效果。

从技术实现角度看，典型的INR架构包含以下几个核心组件：

位置编码层：将输入坐标映射到高维空间，以捕捉高频信号特征。实验中采用256维的位置编码(Npe=256)
多层感知机(MLP)：通常5-8层，使用正弦激活函数(sin)而非ReLU，后者在实验中表现较差（PSNR仅6.04dB）
物理模型约束：通过前向传播模型指导网络优化，确保重建结果符合电磁波传播规律

关键提示：INR的性能高度依赖于激活函数的选择。实验数据表明，sin激活的PSNR达到27.41dB，而ReLU仅6.05dB（表II）。这是因为sin函数能更好地保留高频信息。

2. 多路径干扰下的成像增强

2.1 多路径干扰的形成机制

在实际无线环境中，信号传播会经历直射、反射、绕射等多种路径。如图2(a)所示的典型RIS辅助系统，多路径干扰主要来自：

TX-背景散射体-RX路径
TX-背景散射体-RIS-RX路径
TX-背景散射体-ROI-RX路径

这些路径会在接收端产生叠加干扰，表现为信道矩阵中的Hothers,k项。当干扰能量较大时，传统成像方法的性能会急剧恶化。如表V所示，当TX位置误差达到λ/2时，重建图像已出现严重失真。

2.2 两阶段干扰抑制策略

2.2.1 背景校准技术

我们提出先进行背景校准的预处理步骤：

在无目标状态下测量ROI无关信道Hbg
在实际成像时从测量值Hsen,k中减去背景成分
通过多次测量平均降低校准噪声Nima

数学上，残差信道表示为：

Hima,k = Hroi-bg + (Htx-roi-rx + Htx-roi-ris-rx,k + Htx-ris-roi-rx,k)

其中Hroi-bg代表ROI与背景的耦合干扰，仍是未知项。

2.2.2 联合学习成像与干扰

针对残余干扰Hroi-bg，我们将其建模为可学习参数A：

vec(Hroi-bg) = Aσ

优化问题重构为：

minθ,A μ(f'(Mθ(G°),Ω,A),y) + ρ(Mθ(G°))

通过联合优化图像表示Mθ和干扰矩阵A，系统在SIR>0dB时仍能保持良好性能（图14）。相比传统方法需要SIR>20dB，这是一个显著提升。

实测技巧：背景校准需保证环境静止。建议在系统部署时预留专门校准时段，并通过10次以上测量平均将噪声降低3-5dB。

3. 动态目标成像的实时化方案

3.1 时序相关性利用

动态场景中，相邻时刻的图像具有强相关性。假设t-1时刻的图像表示为Mθt-1，则在t时刻采用先验嵌入的优化目标：

θt* = argminθt μ(f(Mθt(G°),Ω),y; Mθt-1)

这种方法的优势体现在：

训练epoch从5000减少到200，耗时从27s降至1.1s（表VI）
相同epoch下PSNR提升约8dB（图15）
达到相同SSIM所需的epoch减少6-8倍

3.2 实现细节与参数选择

在实际部署时需注意：

学习率调度：初始设为10^-3，50epoch无改善则减半
早停机制：连续200epoch无提升则终止训练
梯度裁剪：限制梯度范数≤2避免发散
稀疏约束：系数α=0.01平衡重建质量与稳定性（表III）

硬件配置建议：

GPU：NVIDIA 4090及以上
内存：≥32GB
框架：PyTorch+CUDA加速

4. 系统级性能验证

4.1 实验配置

我们构建了3GHz频段的仿真系统：

RIS：50×50单元，总面积2.5m×2.5m
天线阵列：8发8收ULA，增益4dBi
噪声功率：-110dBm
ROI：2m×2m区域，离散为100×100像素

数据集采用TikTok舞蹈视频提取的2615张人体分割图，归一化到[0,4πA²/λ²]模拟RCS。

4.2 关键性能指标

分辨率突破：传统衍射极限为λ/2，而INR实现λ/5甚至λ/20分辨率（图13）
抗噪能力：在Pn<-80dBm时SSIM保持>0.9（图12）
距离适应性：存在最优成像距离D0，K=40时D0≈30λ（图9）
训练效率：200epoch即可获得可用结果，耗时约1秒（表II）

4.3 与传统方法对比

如表IV所示，在K=500测量下：

INR的MSE为0.0012，而CS算法需2500次测量仍只有0.2485
SSIM指标从CS的0.1296提升至0.9889
可支持超分辨率重建（ξv=λ/5 vs CS的λ）

5. 典型问题排查指南

5.1 图像模糊或失真

可能原因：

激活函数选择不当→改用sin激活
位置编码缺失→增加Npe=256编码
学习率过高→采用动态调整策略

5.2 训练不收敛

检查清单：

梯度爆炸→启用梯度裁剪
局部最优→加入稀疏约束(α=0.01)
数据问题→验证CSI测量有效性

5.3 实时性不足

优化建议：

采用先验嵌入减少epoch
使用混合精度训练
对静态背景预存Hbg矩阵

6. 进阶应用：通信成像一体化

6.1 通信用户位于ROI内

当用户持手机在成像区域内时（图2a），系统可：

通过INR重建人体图像
用手部检测NN定位设备
优化RIS相位提升SE：

SE(ω) = log2(1 + Pt||hcom(ω)||²/σ²)

实测显示该方法比传统波束扫描快3-5倍。

6.2 通信用户位于ROI外

对于外部用户（图2b），系统通过成像表征多径：

hcom(ω) = gcomgris[Htx-risdiag(h1)+H1diag(hris-ue)]ω + htx-ue + htx-roi-ue

其中H1=Htx-roidiag(σ)Hroi-ris。通过准确建模ROI散射，SE可提升2-3dB。

隐式神经表示(INR)技术在无线感知与成像中的应用