使用D-Wave量子退火训练受限玻尔兹曼机及缓解灾难性遗忘的研究

该研究团队探讨了D-Wave量子退火器(QA)与经典马尔可夫链蒙特卡洛(MCMC)在受限玻尔兹曼机(RBM)采样的性能差异,以解释此前研究中使用D-Wave采样时未能显著提升RBM训练效果的原因。研究人员提出了一种结合经典方法与量子退火贡献的新型混合采样策略,试图利用两种采样方式间的细微差异。然而,该工作并未实现RBM训练的改进,这表明基于QA和MCMC的采样差异(主要分布在概率中低区域,这些区域对样本质量影响较小)尚不足以促进训练效果。此外,将RBM嵌入新一代D-Wave硬件晶格时难以保证高质量嵌入,可能进一步增加了任务复杂度。 另一方面,从概率分布的较低概率区域生成多样化样本的能力,可能有益于其他机器学习应用(例如增量学习中的灾难性遗忘缓解)。该工作首次证明了通过生成式回放利用QA生成目标类别模式来缓解灾难性遗忘的可行性。虽然D-Wave量子退火器的缓解效率与经典方法相当,但其快速生成大量差异化目标模式的能力以及后续优化潜力,使其在多种具有挑战性的机器学习应用中展现出前景。

量科快讯