突破贫瘠高原:深度变分量子电路的强化学习初始化方法
变分量子算法(VQA)已成为利用近期量子设备解决优化、化学模拟及机器学习等应用的重要框架。然而,该算法的有效性常受困于所谓“贫瘠高原”问题——当系统规模或电路深度增加时,梯度会呈指数级衰减,从而阻碍训练过程。该研究团队提出了一种基于强化学习(RL)的参数初始化策略,通过重构初始参数空间以避开梯度消失区域,从而缓解该问题。具体而言,研究人员探索了确定性策略梯度、柔性执行者-评论家、近端策略优化等多种RL算法,在标准梯度优化前生成能最小化VQA成本函数的电路参数(视为动作)。这种RL预训练使后续梯度下降或Adam等优化方法能从更有利的初始状态启动。在不同噪声条件和任务的大量数值实验中,RL初始化方法始终显著提升了收敛速度和最终解质量。多种RL算法的对比表明,不同方法均可实现相近性能提升,印证了该策略的灵活性与鲁棒性。这些发现为机器学习技术与量子算法设计的融合提供了新思路,揭示了RL驱动的参数初始化如何加速VQA的规模化实际应用,尤其为量子机器学习领域(特别是VQA中的贫瘠高原问题)开辟了前景广阔的研究路径。
