多量子比特量子门的强化学习鲁棒校准
高维量子系统(如qudit)相比量子比特具有架构和算法优势,但其日益密集的能谱和有限的可控性使得实现高保真度量子门尤为困难。该研究提出了一种混合优化框架,将最优控制理论方法与情境深度强化学习相结合,旨在两个qutrit系统上实现鲁棒的受控相位门。研究首先利用最优控制为标称系统模型设计高保真度控制脉冲,随后采用强化学习作为校准阶段,在存在静态模型失配的情况下学习对这些脉冲的微小残余校正,从而在实际参数不确定性下保持优良的门操作性能。 通过针对器件特定参数变化学习结构化的低维残余校正,强化学习显著提升了标称最优但参数敏感的控制方案在器件集群间的迁移鲁棒性。值得注意的是,该框架中的强化学习步骤并非与最优控制步骤竞争,而是为实际硬件提供必需的适应性,系统性降低对参数波动的敏感性。研究结果证实,强化学习可作为高维系统中量子门鲁棒校准的实用且可扩展的解决方案。

