通过强化学习实现结构化变分量子电路的自动化设计
变分量子算法(VQAs)是当前利用近期量子硬件最具前景的解决方案之一,但其效率高度依赖于底层电路ansatz的设计——这类结构通常采用启发式方法构建。该工作将变分量子电路合成建模为顺序决策问题,通过迭代添加量子门来优化目标函数,并提出了两种针对组合优化问题的强化学习方法:RLVQC全局方案与RLVQC模块化方案。其中,RLVQC模块化方案通过发现可应用于所有相互作用量子比特对的二量子位模块,构建了能推广量子近似优化算法(QAOA)的ansatz结构;而RLVQC全局方案进一步突破约束,不受相互作用量子比特结构的限制自由添加量子门。两种方法均采用近端策略优化(PPO)算法,并利用实验测量结果作为状态观测来指导智能体决策。研究团队在源自经典图论优化问题的QUBO实例集上评估了所提方法,结果表明:两种RLVQC方案均表现优异,其中模块化方案不仅持续超越QAOA,总体上还优于全局方案。值得注意的是,模块化方案生成的电路深度与QAOA相当,而全局方案则能发现显著更短的电路结构。这些发现表明,强化学习方法能有效探索针对特定问题定制的新型ansatz结构,同时揭示最优电路设计策略介于严格预定义架构与完全无约束方案之间,在结构刚性与适应性之间实现了理想平衡。
