Wasserstein距离在蒙特卡洛模拟中的应用与优化-编程实验室

1. Wasserstein距离与蒙特卡洛模拟的基础原理

1.1 什么是Wasserstein距离

Wasserstein距离（又称Earth Mover's Distance）是衡量两个概率分布之间差异的数学工具。想象你有一堆沙子堆成山A，需要搬运成山B的形状——Wasserstein距离就是完成这个搬运所需的最小"工作量"。在数学上，它定义为：

W_p(μ,ν) = (inf_{γ∈Γ(μ,ν)} ∫_{X×X} d(x,y)^p dγ(x,y))^{1/p}

其中Γ(μ,ν)是所有联合分布，其边缘分布分别为μ和ν。p=1时就是我们最常用的一阶Wasserstein距离。

与KL散度等传统度量相比，Wasserstein距离的优势在于：

能处理支撑集不重叠的分布
对微小变化更鲁棒
具有直观的几何解释

1.2 蒙特卡洛模拟中的分布评估挑战

蒙特卡洛方法通过随机采样近似复杂概率分布时，面临两个核心问题：

采样不足导致的偏差（如图2b中只捕捉到一个模态）
收敛速度评估困难

传统方法如KS检验或直方图对比存在局限：

对高维数据敏感
无法反映分布间的几何关系
对采样噪声不稳定

这正是Wasserstein距离大显身手的地方。在您提到的蒙特卡洛收敛挑战案例中，输入分布pXcon是双峰高斯混合，经过非线性变换fcon后输出分布pYcon仍保持双峰特性。使用Wasserstein距离可以准确量化不同采样数下模拟结果与真实分布的差距。

2. 实验设计与实现细节

2.1 基准真值构建

如文中C.2节所述，建立可靠的基准真值至关重要。我们采用：

超大样本量（1,000,000次）蒙特卡洛模拟
使用scipy.stats.wasserstein_distance计算距离
确保计算可复现性的措施：
- 固定随机种子
- 5秒间隔重复实验（避免系统缓存影响）
- 统一单线程运行（保持比较公平性）

2.2 硬件配置与参数选择

实验环境：

Apple M1 Pro芯片
16GB LPDDR5内存
macOS 13.5.1系统

关键参数扫描：

传统蒙特卡洛：n ∈ [4, 256, 1152, ..., 256000]
Signaloid UxHw：r ∈ [16, 32, 64, 128, 256, 2048]

注意：Signaloid的采样时间不计入总耗时，因其内部表示不是基于采样

2.3 核心代码实现

使用Python的SciPy库计算Wasserstein距离：

from scipy.stats import wasserstein_distance def evaluate_simulation(ground_truth, simulation_samples): """ ground_truth: 基准分布的样本数组 (1M个) simulation_samples: 待评估的模拟样本 返回: Wasserstein距离 """ return wasserstein_distance(ground_truth, simulation_samples)

3. 结果分析与性能对比

3.1 蒙特卡洛收敛挑战案例

表2数据显示：

Signaloid UxHw (r=32)：
- Wasserstein距离：0.00167±0.00007
- 耗时：0.020±0.004 ms
等效精度的传统MC需32,000样本：
- 距离：0.00158±0.00068
- 耗时：2.277±0.346 ms
- 速度差：113.85倍

达到更高精度时：

1σ优于Signaloid需128,000样本（411.25倍耗时）
2σ优于Signaloid需256,000样本（732.35倍耗时）

3.2 泊肃叶定律血液传输案例

表3显示不同趋势：

Signaloid UxHw (r=32)：
- 距离：0.00033±0.00003
- 耗时：0.173±0.006 ms
传统MC需256,000样本达到类似精度：
- 距离：0.00023±0.00008
- 耗时：15.303±2.611 ms
- 速度差：51.53倍

3.3 分布形态对比分析

图4揭示有趣现象：

Signaloid的输出分布：
- 主峰更尖锐
- 尾部概率较低
- 即使r增大仍保持此特征
传统蒙特卡洛：
- 随样本增加逐渐逼近真实分布
- 能更好捕捉尾部特性

这表明两种方法在不确定性传播处理上存在本质差异。

4. 工程实践建议

4.1 方法选型决策树

根据实际需求选择：

是否需要实时性？ ├─ 是 → Signaloid UxHw (r=32~64) └─ 否 → 传统蒙特卡洛 ├─ 需要精确尾部概率？ → ≥128,000样本 └─ 关注主要模态 → 32,000~64,000样本

4.2 参数调优经验

对于传统蒙特卡洛：

初始测试用n=1,000快速评估分布形态
逐步增加至Wasserstein距离变化<5%
多峰分布需额外验证各模态采样充分性

对于Signaloid UxHw：

从r=32开始测试
每次倍增r直到距离改善<10%
注意r>128时耗时非线性增长

4.3 常见陷阱与解决方案

问题1：Wasserstein距离计算慢

解决方案：对大数据集使用Sinkhorn近似

问题2：Signaloid结果过于"自信"

解决方案：后处理时人工添加噪声

问题3：多模态采样偏差

解决方案：使用分层抽样或MCMC

5. 高级应用拓展

5.1 自适应采样策略

结合Wasserstein距离实现智能采样：

def adaptive_mc(target_dist, initial_n=1000, tol=0.001): current_samples = generate_samples(initial_n) while True: w_dist = wasserstein_distance(target_dist, current_samples) if w_dist < tol: break # 在差异大的区域增加采样 new_samples = focus_sample(w_dist) current_samples = np.concatenate([current_samples, new_samples]) return current_samples