受限玻尔兹曼机概率分布的采样对比:D-Wave量子退火与马尔可夫链蒙特卡洛方法
一项基于局部谷(LV)中心的采样质量评估方法被应用于评估最新一代D-Wave量子退火器对受限玻尔兹曼机(RBM)的采样效果。研究人员从经典训练的RBM中获取了D-Wave采样和吉布斯采样数据,采样条件与基于对比散度的RBM学习相关。通过比较两种采样方法获得的局部谷数量及对应局部极小值的能量,该工作发现:缩短D-Wave退火时间并未显著(理想地)增加局部谷数量。在任意训练周期中,D-Wave采样所覆盖的局部谷数量略高于吉布斯采样,但两种技术发现的局部谷存在显著差异。对于高概率采样状态,两种技术(不利地)表现出较低互补性和较高重叠性。但值得注意的是,许多具有中等概率值的潜在“重要”局部极小值仅被其中一种技术发现。随着训练周期推进,两种技术的重叠度逐渐降低——这一阶段恰恰是采样质量微小改进可能显著影响RBM可训练性的关键时期。该研究结果解释了先前基于D-Wave采样的研究未能取得实质性提升的原因,同时也揭示了混合经典-量子方法的改进潜力。
