PearSAN框架：基于皮尔逊相关的代理模型加速纳米光子逆向设计-编程实验室

1. 逆向设计：从直觉到算法的范式转变

在纳米光子学领域，设计一个能精确操控光波的超表面，传统上依赖于研究人员的物理直觉和“试错”式的参数扫描。比如，你想设计一个能让特定波段的光几乎完全吸收，而其他波段的光完全反射的热光伏发射器。过去，工程师可能会从经典的“间隙等离子体”结构入手——一个金属背板、一层介质间隔层，再加上一层周期性的金属纳米天线阵列。这种结构原理直观，但性能天花板很快就触顶了，效率往往难以突破85%。为什么？因为光与物质在纳米尺度的相互作用极其复杂，可调参数（天线的形状、尺寸、排列、材料）组合起来是一个天文数字，构成了一个超高维、非凸的“设计空间”。在这个空间里，性能的“山峰”和“谷底”交错，传统的梯度优化方法就像蒙着眼睛爬山，极易掉进一个看似不错的“小土坡”（局部最优解），而错过了远处真正的“珠穆朗玛峰”（全局最优解）。这就是所谓的“维度灾难”。

逆向设计，正是为了正面迎击这一挑战而生的方法论。它的核心思想是“目标驱动”：我不关心结构长什么样，我只关心它最终的性能指标（比如，在0.5到1.7微米波段吸收率接近1，之外接近0）。然后，我将这个性能目标数学化，构建一个“品质因数”（Figure of Merit, FOM），让算法在这个由无数可能结构组成的、黑暗而广阔的高维空间中，自动地、智能地搜索出能最大化FOM的那个最优结构。这就像给算法一个“性能罗盘”，让它代替人脑，在设计的“黑暗森林”中探险。

然而，给算法装上罗盘只是第一步。每一次评估一个候选结构，都需要进行一次耗时的全波电磁仿真（如FDTD），这就像每次探险都要派一架侦察机去实地勘测，成本极高。为了加速，研究者引入了“代理模型”（Surrogate Model）——一个用大量已有仿真数据训练出来的、能快速预测新结构性能的机器学习模型。它就像一张根据已有侦察报告绘制的、不太精确但绘制迅速的地图。传统的代理模型训练目标是让地图上的海拔高度（预测值）尽可能接近真实海拔（仿真值），即最小化均方误差（MSE）。但这里存在一个根本矛盾：对于优化而言，我们真的需要知道每个点的精确海拔吗？不，我们只需要知道哪个山头更高，即保持性能的“排序”信息正确。过度追求精确海拔，反而可能因为地图在某些区域的微小失真，误导探险队走向一个错误的“山坡”。

PearSAN框架的提出，正是洞察并解决了这一核心矛盾。它不再要求代理模型精确拟合FOM的绝对值，而是通过皮尔逊相关系数，强制要求代理模型的输出（能量值）与真实FOM值保持严格的单调（反相关）关系。简单说，就是确保“在地图上，越高的山头，标注的能量值越低”。这解放了代理模型的表达能力，让它能更专注于学习设计空间的相对优劣格局。结合能高效在离散空间采样的“变分神经退火”算法，PearSAN实现了在庞杂的设计空间中既快又准的导航。

1.1 核心需求：热光伏超表面的光谱“手术刀”

为了具体说明PearSAN的威力，我们以其在热光伏（TPV）超表面单元设计中的应用为例。TPV系统是将热能（如工业废热）直接转换为电能的技术，其核心是一个热发射器和一个光伏（PV）电池。理想的热发射器，其发射谱应该像一把精准的“手术刀”：在PV电池的工作波段（例如GaSb电池的0.5-1.7微米）内，发射率接近1（ε=1）；在此波段外，发射率接近0。任何工作波段外的发射，都是纯粹的热损耗，会降低系统效率和器件寿命。

我们的设计对象是一个三层结构：280nm的氮化钛（TiN）背反射层，30nm的氮化硅（Si3N4）间隔层，以及一个120nm厚的、由TiN构成的顶层纳米天线图案层。这个顶层图案被离散化为一个64x64的二进制网格（1代表TiN，0代表空气），这就是我们的设计变量，总共约有2^4096种可能，是一个无法暴力搜索的空间。优化的目标，就是在这个64x64的“像素画布”上，“画”出一个最优的TiN分布图案，使得其吸收谱（在发射器中，吸收率等于发射率）无限逼近那个理想的阶跃函数。

品质因数FOM被设计为加权光谱平均，其数学形式（对应原文公式5）直观地体现了这一目标：FOM = ∫ [A_id(λ)*A(λ) + (1-A_id(λ))*(1-A(λ))] dλ / ∫ [A_id(λ) + (1-A_id(λ))] dλ其中，A_id(λ)是理想吸收谱（阶跃函数），A(λ)是实际结构的吸收谱。这个公式巧妙之处在于，它在目标波段内鼓励高吸收（第一项），在目标波段外鼓励低吸收（第二项），从而同时最大化带内效率和最小化带外效率。最终的系统效率是带内效率与带外效率的乘积，我们的优化直接针对这个复合FOM进行。

2. PearSAN框架深度拆解：为何是“相关”而非“拟合”

要理解PearSAN的创新，必须深入其两个核心组件：用于训练代理模型的皮尔逊相关损失（PearSOL），以及用于在潜在空间采样的变分神经退火（VNA）。它们共同解决了传统方法在离散、高维、非凸优化中的痛点。

2.1 潜在空间优化：从“像素海洋”到“特征大陆”

直接在上百万维的二进制像素空间优化是不现实的。因此，我们首先需要一个“地图绘制仪”——一个二值自编码器（bAE）。我们用拓扑优化生成的12,000个高性能TPV结构数据集来训练这个bAE。它的编码器将每个64x64的二进制结构压缩成一个低维的潜在向量（比如128维），而解码器则能将这个向量还原回结构。这个潜在空间，就是经过压缩和提炼的“特征大陆”。好的潜在空间具有连续性：潜在向量之间微小的变化，解码出的结构在形态和功能上也是渐变的。这为优化算法提供了平滑的导航基础。

但有了地图还不够，我们需要一个能在地图上标识“资源富集区”（高性能结构区域）的机制。这就是代理模型h_ϕ(z)的作用。它输入一个潜在向量z，输出一个标量能量值E。在优化语境下，我们希望能量值越低，对应的解码结构性能（FOM）越高。传统方法用能量匹配（EM）损失（如L2损失）来训练h_ϕ(z)，强制要求-E ≈ FOM。这带来了几个问题：

过度约束：代理模型被迫在绝对值上逼近FOM，而FOM的值域可能很广或分布不均，这增加了模型拟合的难度，可能导致在某些区域拟合得很好，在另一些区域却很差。
对噪声敏感：L2损失对异常值（比如某个因仿真误差导致FOM异常高或低的点）非常敏感，一个异常点可能把整个代理模型的预测带偏。
忽略核心需求：对于优化，我们只关心排序。即使代理模型预测的能量值是[-100, 100]，而真实FOM是[0.8, 0.95]，只要z_a对应的能量-90小于z_b对应的能量50，且真实FOM(z_a)的0.94大于FOM(z_b)的0.85，那么这个代理模型对于优化器来说就是完美的。EM损失无法区分这种“排序正确但绝对值偏差大”的情况和“排序错误”的情况。

PearSOL的提出，正是为了从根本上改变训练目标。它使用皮尔逊相关系数作为损失函数的核心：L_Pearson = -cov(F, H) / (σ_F * σ_H)其中，F是一批样本的真实FOM集合，H是对应的代理模型能量集合。皮尔逊系数的值域为[-1, 1]。1表示完��正相关，-1表示完全负相关。我们的目标是让H与F完全负相关，即L_Pearson趋近于-1。这意味着，当FOM增大时，能量H必须单调减小，反之亦然。它只约束两列数据之间的单调趋势，而不关心它们具体的数值比例或偏移。

实操心得：理解PearSOL的灵活性在实际代码实现中，为了优化稳定，我们通常不会直接最小化-L_Pearson（因为其值域有界），而是将其作为一个正则项，并结合其他项。例如，原文中的完整损失L_PearSOL = λ_a*L_Pearson + λ_b*L_Avg + λ_c*L_Norm。其中L_Avg鼓励能量值的平均值更低（推动采样向低能量区域集中），L_Norm防止能量值参数爆炸。λ_a, λ_b, λ_c是需要调节的超参数。我的经验是，初期应给L_Pearson较大的权重（如λ_a=1.0），以确保排序关系快速建立；中后期可以适当增加L_Avg的权重，以精细地“压榨”出潜在空间中的最低能量点。

2.2 变分神经退火：在离散空间中的智能“掘金”

有了一个能可靠指示“哪里矿藏更丰富”（哪里能量更低，即性能更高）的代理模型地图，下一步就是派出一支高效的“采矿队”去那些低能量区域采样。潜在向量z的每个维度通常是二值（0或1）或离散的，这排除了使用基于梯度的连续优化方法。

变分神经退火（VNA），特别是其变体变分经典退火（VCA），是解决离散优化的利器。它受启发于统计物理中的退火过程：

能量模型：代理模型h_ϕ(z)在这里被视作一个伊辛模型类型的能量函数。z是自旋组态，h_ϕ(z)是该组态的能量。
采样器：我们用一个循环神经网络（RNN）来构建一个概率分布q_ϕ(z)，用它来采样潜在向量。RNN以自回归的方式生成z的每一位：p(z_i | z_1, ..., z_{i-1})。
退火训练：训练RNN的目标是最小化变分自由能：G = E_{z~q}[h_ϕ(z)] - T * S(q)。
- 第一项是平均能量，鼓励采样低能量状态。
- 第二项是熵S(q)乘以温度T。熵代表分布的混乱程度。高温时，熵项占主导，鼓励探索（高多样性）；随着温度T从高到低保真地降低，熵项的影响减弱，系统逐渐聚焦到低能量状态（ exploitation ）。

这个过程就像冶炼金属：先高温加热（高T，大量随机探索，避免陷入局部最优），然后缓慢冷却（T降低，逐渐收敛到能量最低的晶态）。VCA通过RNN参数化q_ϕ(z)，并利用梯度下降直接优化自由能G，相比传统的模拟退火或马尔可夫链蒙特卡洛，在复杂离散空间中的混合（探索）和收敛速度通常更快。

2.3 PearSAN工作流：一个高效的协同循环

PearSAN将PearSOL和VCA编织成一个迭代的、自我提升的闭环系统，其工作流程（对应原文图2和算法1）清晰而高效：

初始化：从bAE编码的初始数据集Z^(0)开始，并有一个预训练好的、固定的解码器D_θ和一个快速评估FOM的代理模型（如VGGNet回归器）。
迭代循环（对于 τ = 0 到 τ_max-1）： a.代理模型训练：使用当前累积的潜在向量数据集Z^(τ)及其对应的解码结构FOM值F^(τ)，通过最小化PearSOL损失来训练/更新多项式代理模型h_ϕ^(τ)(z)。这一步确保h_ϕ的排序与真实FOM保持一致。 b.退火采样：以当前训练好的h_ϕ^(τ)作为能量函数，运行VCA训练RNN采样器q_ϕ^(τ)。在退火初期的高温阶段进行探索性采样，在温度降低后采集一批低能量的候选潜在向量Ẑ^(τ)。 c.评估与扩充：将Ẑ^(τ)通过解码器D_θ得到新结构，用快速评估模型（VGGNet）计算其FOM。将这些新的(z, FOM)对加入到数据集中：Z^(τ+1) = Z^(τ) ∪ Ẑ^(τ)。
输出：经过τ_max轮迭代后，从最终数据集Z^(τ_max)中选取FOM最高的设计，必要时可用高保真仿真（如FDTD）进行最终验证。

这个循环的巧妙之处在于“数据滚雪球”效应。每一轮迭代产生的、针对当前代理模型优化的新样本，都会成为下一轮训练代理模型更好的数据，使其对高性能区域的边界和地形越来越了解，从而引导采样器更精准地找到富矿。

3. 实战推演：从代码到结构

让我们更具体地拆解几个关键环节的实现细节和注意事项。假设我们使用PyTorch框架。

3.1 构建二值自编码器（bAE）

bAE的目标是学习一个紧凑的、连续的潜在表示。由于输入是二值图像（0或1），解码器的最后一层通常使用Sigmoid激活函数，输出值在0到1之间，代表该像素是TiN的概率。损失函数通常是重建损失（如二元交叉熵）加上一个潜在空间的正则项（如Kullback-Leibler散度，用于VAE）。

import torch import torch.nn as nn import torch.nn.functional as F class BinaryEncoder(nn.Module): def __init__(self, latent_dim=128): super().__init__() # 示例：简单的卷积编码器 self.conv1 = nn.Conv2d(1, 32, kernel_size=3, stride=2, padding=1) # 64x64 -> 32x32 self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=2, padding=1) # 32x32 -> 16x16 self.conv3 = nn.Conv2d(64, 128, kernel_size=3, stride=2, padding=1) # 16x16 -> 8x8 self.fc_mu = nn.Linear(128 * 8 * 8, latent_dim) self.fc_logvar = nn.Linear(128 * 8 * 8, latent_dim) # 用于VAE def forward(self, x): x = F.relu(self.conv1(x)) x = F.relu(self.conv2(x)) x = F.relu(self.conv3(x)) x = x.view(x.size(0), -1) mu = self.fc_mu(x) logvar = self.fc_logvar(x) return mu, logvar class BinaryDecoder(nn.Module): def __init__(self, latent_dim=128): super().__init__() self.fc = nn.Linear(latent_dim, 128 * 8 * 8) self.deconv1 = nn.ConvTranspose2d(128, 64, kernel_size=3, stride=2, padding=1, output_padding=1) self.deconv2 = nn.ConvTranspose2d(64, 32, kernel_size=3, stride=2, padding=1, output_padding=1) self.deconv3 = nn.ConvTranspose2d(32, 1, kernel_size=3, stride=2, padding=1, output_padding=1) def forward(self, z): x = F.relu(self.fc(z)) x = x.view(-1, 128, 8, 8) x = F.relu(self.deconv1(x)) x = F.relu(self.deconv2(x)) x = torch.sigmoid(self.deconv3(x)) # 输出概率图 return x # 训练时，对于VAE，需要重参数化技巧采样z，并使用BCE损失和KL散度 def loss_function(recon_x, x, mu, logvar): BCE = F.binary_cross_entropy(recon_x, x, reduction='sum') KLD = -0.5 * torch.sum(1 + logvar - mu.pow(2) - logvar.exp()) return BCE + KLD

注意事项：二值化的处理解码器输出的是概率图，而非严格的0/1。在生成最终用于仿真的结构时，我们需要一个二值化步骤（如阈值取0.5）。但在训练bAE和后续生成用于PearSAN的潜在向量时，我们通常直接使用概率图，或者使用Gumbel-Softmax等技巧来获得可微的二值化。在PearSAN的上下文中，潜在空间Z通常是离散的（例如，对概率进行伯努利采样得到二值潜在向量），这与VCA采样离散向量的特性是匹配的。

3.2 实现PearSOL损失函数

PearSOL损失是框架的灵魂。其实现需要计算一批样本的FOM和代理模型能量之间的皮尔逊相关系数。

def pearsol_loss(energy_pred, fom_true, lambda_a=1.0, lambda_b=0.1, lambda_c=0.01): """ energy_pred: 代理模型预测的能量值 (batch_size,) fom_true: 真实的FOM值 (batch_size,) lambda_a, lambda_b, lambda_c: 超参数 """ # 1. 皮尔逊相关损失 (鼓励负相关) # 减去均值 pred_centered = energy_pred - torch.mean(energy_pred) true_centered = fom_true - torch.mean(fom_true) # 计算协方差和标准差 cov = torch.sum(pred_centered * true_centered) std_pred = torch.sqrt(torch.sum(pred_centered ** 2) + 1e-8) std_true = torch.sqrt(torch.sum(true_centered ** 2) + 1e-8) # 皮尔逊相关系数 pearson_corr = cov / (std_pred * std_true + 1e-8) # 我们希望 energy_pred 与 fom_true 负相关，所以损失是 (pearson_corr - (-1))^2 或直接使用 -pearson_corr # 使用均方误差形式更稳定 L_pearson = (pearson_corr - (-1.0)) ** 2 # 目标相关系数为-1 # 2. 平均能量损失 (鼓励能量值更低) L_avg = torch.mean(energy_pred) # 3. 能量值范数正则化 (防止参数爆炸) L_norm = torch.mean(energy_pred ** 2) # 4. 组合损失 total_loss = lambda_a * L_pearson + lambda_b * L_avg + lambda_c * L_norm return total_loss, pearson_corr.item() # 返回总损失和相关系数用于监控

实操心得：损失平衡与监控训练初期，应密切监控pearson_corr的值。我们的目标是使其快速趋近于-1。如果L_avg下降太快而pearson_corr还很差，说明代理模型可能在“作弊”——单纯地降低所有能量值，而没有建立正确的排序关系。此时应调高lambda_a。L_norm是一个安全网，防止能量值走向负无穷，通常权重lambda_c可以设得很小（如0.001）。

3.3 构建代理模型与VCA采样器

代理模型h_ϕ(z)在原文中是一个多项式（见公式11），这对于二值输入z ∈ {0, 1}^n是自然的，因为任何布尔函数都可以用多项式展开（Walsh-Hadamard变换）。但在实践中，对于上百维的潜在空间，完整的多项式展开项数会爆炸。我们通常采用低阶近似，例如只考虑到二阶或三阶相互作用。

class PolynomialSurrogate(nn.Module): def __init__(self, latent_dim, order=2): super().__init__() self.latent_dim = latent_dim self.order = order # 一阶项参数 self.linear = nn.Linear(latent_dim, 1, bias=False) # 二阶项参数 (可选) if order >= 2: # 用一个矩阵来表示所有二阶交互项，注意其对称性 self.quadratic = nn.Parameter(torch.zeros(latent_dim, latent_dim)) else: self.quadratic = None # 可以继续添加更高阶项... def forward(self, z): # z: (batch_size, latent_dim), 假设已经是二值或可微的近似 energy = self.linear(z).squeeze(-1) # 一阶贡献 if self.quadratic is not None: # 计算 z^T * Q * z，其中Q是上三角或对称矩阵以避免重复计算 # 简单实现：求和所有 i<j 的 Q_ij * z_i * z_j quad_term = 0.5 * torch.sum((z @ self.quadratic) * z, dim=1) # 近似，需确保对称性 energy = energy + quad_term return energy # (batch_size,)

VCA采样器使用RNN来建模q_ϕ(z)。对于二值潜在向量，我们可以使用LSTM或GRU。

class VCASampler(nn.Module): def __init__(self, latent_dim, hidden_size): super().__init__() self.latent_dim = latent_dim self.hidden_size = hidden_size self.lstm = nn.LSTM(input_size=1, hidden_size=hidden_size, batch_first=True) # 线性层将LSTM隐藏状态映射为伯努利分布参数 self.fc = nn.Linear(hidden_size, 1) def forward(self, batch_size, temperature=1.0): # 生成一个序列的伯努利概率 hidden = None samples = [] log_probs = [] input = torch.zeros(batch_size, 1, 1).to(device) # 初始输入 for i in range(self.latent_dim): lstm_out, hidden = self.lstm(input, hidden) logits = self.fc(lstm_out.squeeze(1)) # (batch_size, 1) # 通过Gumbel-Softmax得到可微的近似伯努利采样 probs = torch.sigmoid(logits / temperature) # 采样 u = torch.rand_like(probs) gumbel_noise = -torch.log(-torch.log(u + 1e-8) + 1e-8) y = torch.sigmoid((logits + gumbel_noise) / temperature) # 计算对数概率（用于自由能计算） log_prob = F.binary_cross_entropy_with_logits(logits, y, reduction='none') samples.append(y) log_probs.append(log_prob) # 将当前采样结果作为下一步输入（自回归） input = y.unsqueeze(1) samples = torch.stack(samples, dim=1).squeeze(-1) # (batch_size, latent_dim) log_probs = torch.stack(log_probs, dim=1).sum(dim=1) # (batch_size,) return samples, log_probs def free_energy(self, energy_fn, batch_size, temperature): """计算变分自由能的蒙特卡洛估计""" z, log_q = self(batch_size, temperature) # 从q_phi采样z并得到log概率 energy = energy_fn(z) # 通过代理模型计算能量 free_energy_estimate = torch.mean(energy - temperature * log_q) return free_energy_estimate

在VCA训练中，我们通过最小化free_energy来更新采样器RNN的参数ϕ，其中energy_fn就是当前的代理模型h_ϕ(z)。温度T会随着训练周期（或epoch）从高到低衰减。

4. 结果分析与避坑指南

根据原文的基准测试，PearSAN在TPV设计问题上取得了约97.02%的效率，同时采样速度极快（每小时可生成超过500个设计）。这验证了其框架的有效性。但在实际复现或应用于其他问题时，以下几个环节容易出问题，需要特别注意。

4.1 数据准备与bAE训练

问题：bAE重建质量差，导致潜在空间不连续或信息丢失严重。

排查：检查重建损失（如BCE）和感知损失（如使用预训练VGG的特征图差异）。如果重建图像模糊或结构扭曲，解码器可能无法忠实还原高性能设计。
解决：
1. 增加数据集多样性：确保拓扑优化生成的数据集覆盖了足够多样的高性能结构模式。如果数据集模式单一，bAE学到的潜在空间会非常狭窄。
2. 调整bAE架构和容量：增加网络深度/宽度，或尝试更先进的架构（如带有残差连接的自编码器）。潜在维度也需要权衡，太小会丢失信息，太大会增加优化难度。
3. 引入感知损失：在像素级重建损失外，加入基于VGG等网络的特征图匹配损失，能更好地保留结构的宏观拓扑特征。
4. 验证潜在空间插值：随机取两个潜在向量z1,z2，在其连线上均匀插值并解码，观察生成的结构是否平滑过渡。如果出现突变或无意义结构，说明潜在空间连续性不佳。

4.2 代理模型（PearSOL）训练不稳定

问题：皮尔逊相关系数震荡，无法稳定趋近-1，或代理模型能量与FOM排序关系混乱。

排查：绘制每个训练批次（或epoch）的pearson_corr、L_avg、L_norm以及代理模型预测能量与真实FOM的散点图。
解决：
1. 调整损失权重：这是最关键的超参数。如果pearson_corr不下降，大幅提高lambda_a（如从1.0调到5.0）。如果能量值出现极端负值，提高lambda_c。
2. 批次大小：使用较大的批次大小（如256或512）可以更稳定地估计皮尔逊相关系数。
3. 代理模型复杂度：如果潜在维度高，二阶多项式可能不足以捕捉复杂关系。可以尝试增加到三阶，或换用一个小型神经网络（如3层MLP）作为代理模型。但要注意，过于复杂的模型在小数据集上容易过拟合。
4. 数据标准化：虽然皮尔逊相关对线性缩放不变，但对输入数据（FOM）进行适当的标准化（如减去均值，除以标准差）有时能稳定训练。

4.3 VCA采样器陷入局部最优或多样性不足

问题：采样器很快收敛，只反复生成少数几个类似的结构，无法探索新的高性能区域。

排查：观察采样器在训练过程中生成的潜在向量的多样性（例如，计算不同样本间的汉明距离），以及这些样本解码后的FOM分布是否集中。
解决：
1. 退火计划：确保温度T的衰减足够慢。例如，使用指数衰减：T = T0 * (decay_rate)^epoch，其中decay_rate接近1（如0.99）。过快的冷却会导致早熟收敛。
2. 初始温度T0：提高初始温度可以增加初始探索的随机性。如果一开始多样性就低，尝试增大T0。
3. 采样器容量：增加RNN采样器的隐藏层维度或层数，提高其建模复杂分布的能力。
4. 引入熵正则化：在VCA的自由能目标中，可以额外添加一个熵最大化项，明确鼓励分布q_ϕ(z)的多样性，防止模式坍塌。

4.4 迭代循环效率低下或性能不提升

问题：运行多轮PearSAN迭代后，最佳FOM没有显著提升，甚至下降。

排查：绘制每轮迭代后，新采样样本的FOM分布图，以及历史最佳FOM的变化曲线。
解决：
1. 评估模型准确性：检查快速评估模型（如VGGNet回归器）的预测是否准确。用一组独立的、经过高保真仿真验证的数据测试其误差。如果评估模型不准，整个优化方向就是错的。
2. 控制探索与利用：在VCA采样阶段，不要只收集低温（低T）下的“最优”样本。按照原文策略，在训练初期（高T阶段）也收集一些样本（N_thresh之后），这些样本虽然能量不一定最低，但可能来自新的、有潜力的区域，能帮助代理模型更好地刻画全局地形。
3. 潜在空间质量：如果bAE的潜在空间本身质量不高（高性能区域不连续或占比极小），那么再好的优化算法也难为无米之炊。回头检查并提升bAE的训练。
4. 迭代次数与数据集大小：确保迭代次数τ_max足够，并且每轮新增的样本数量能有效更新代理模型。如果每轮只加几个样本，可能不足以改变代理模型的认知。

4.5 从优化结果到实际器件

问题：算法找到的高FOM结构，在严格的电磁仿真或实际加工中性能下降。

排查：这是“仿真-现实”鸿沟的典型问题。快速评估模型（VGGNet）的预测误差、以及算法找到的结构是否包含不切实际的微小特征（< 30 nm）。
解决：
1. 仿真保真度：最终验证必须使用高精度的全波仿真工具（如FDTD, FEM）。
2. 制造约束：在优化循环中或后处理时加入制造约束。正如原文所述，在拓扑优化阶段就应用了“三步骤稳健性算法”：材料插值、几何扰动平均、空间滤波（去除亚30nm特征）。在PearSAN生成结构后，也应进行类似的后处理（如形态学开闭运算）以确保结构可制造。
3. 多物理场验证：对于TPV器件，还需考虑热效应、材料在不同温度下的光学性质变化等。优化时使用的材料参数（如室温下的折射率）可能与工作温度下的实际情况有出入。

我个人在尝试将类似框架应用于其他光子器件设计时，一个深刻的体会是：代理模型的质量是整个流程的“天花板”。无论后面的优化算法多精妙，如果代理模型不能可靠地反映真实物理性能的相对关系，一切努力都可能白费。因此，投入足够精力构建一个准确、高效的快速评估模型（无论是基于物理的简化模型还是数据驱动的神经网络），是项目成功的前提。PearSOL通过放松对绝对精度的追求，转而保证排序正确性，实际上是降低了对代理模型“天花板”的要求，使其更容易被训练好，这是其成功的关键洞见之一。最后，任何逆向设计流程的终点都应该是高保真仿真和实验验证，算法给出的“最优解”始终是一个需要物理世界检验的“候选者”。