揭示鲁棒脉冲序列中的潜在结构:一种基于模型的强化学习的自适应量子控制方法

实时自适应控制量子系统要求在连续变化的工作条件范围内快速生成鲁棒、高保真度的脉冲。标准优化算法(如梯度上升脉冲工程,GRAPE)会独立求解每个实例,但在运行之间丢弃信息,当参数变化时需进行昂贵的重新初始化。该研究提出了一种基于模型的强化学习方法用于鲁棒最优量子控制,其中单一神经网络——将哈密顿量直接嵌入训练流程——能在整个门配置族上生成鲁棒门,而无需预计算训练数据。在单自旋(两能级)系统上的演示表明,训练后的网络能在毫秒级时间内为任意旋转角度生成脉冲,覆盖一定范围的脉冲持续时间、失谐和场不均匀性,其保真度与多种子GRAPE相当。该框架具有内在适应性:任何进入哈密顿量的参数均可作为网络输入,从而将方法扩展到不同系统和控制设置。除了速度优势外,网络揭示了控制景观中的结构:它发现了与GRAPE解中相同的结构化相位剖面——通过保真度不变对称变换使其可识别——且比独立优化更具一致性。这种一致性使得能在整个训练参数空间上进行平滑插值。
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-06-23 12:37

量科快讯