通过强化学习实现变分量子算法的经典态制备

变分量子算法(VQAs)可能为实现实际量子优势提供一条路径,但其优化过程严重受限于贫瘠高原和大量局部极小值。虽然经典可模拟的克利福德电路可以通过热启动VQAs来加速收敛,但现有基于启发式的初始化方法在庞大的组合搜索空间中难以扩展。为了突破这一瓶颈,该团队提出了CRiSP(用于状态准备的克利福德强化学习智能体)框架,该框架将离散前缀选择形式化为一个序贯决策问题。CRiSP利用神经引导的蒙特卡洛树搜索,由通过自我对弈训练的基于Transformer的策略驱动,在固定参数化旋转之前插入学习到的克利福德门。这使得该工作能够完全通过多项式时间的经典稳定子模拟构建高质量的初始状态,而无需改变底层电路架构。通过集成一种逐步扩展搜索范围的课程学习策略,该智能体能够高效扩展到深层电路。在最多包含22个量子比特和1,370个参数的QAOA基准测试中,CRiSP在平均能量精度上优于最先进的克利福德初始化方法平均3.17倍(最大45.02倍),在最佳实现能量精度上优于2.44倍(最大16.01倍)。对VQE任务的评估进一步证明了该框架的鲁棒性和泛化能力。
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-05-22 01:24

量科快讯