自旋磁力计最优控制的强化学习

在存在退相干的情况下实现量子最优控制具有挑战性,尤其是在量子传感应用中,并非所有哈密顿量参数都能被精确获知时。在此背景下,最大化系统灵敏度成为目标,然而最优目标态或幺正变换往往未知,特别是在多参数估计场景中。该研究团队探索了强化学习(RL)——尤其是柔性执行者/评价者(SAC)算法——在量子最优控制问题中的应用。研究人员选取基于自旋的磁强计作为评估SAC算法效能的基准系统。此类系统中,作用于自旋的背景磁场强度可通过投影测量确定,而通过施加不同强度的横向场脉冲序列可优化测量精度。该团队在自旋系统的数值模拟中训练强化学习智能体,以寻找优化精度的横向场脉冲序列,并与现有传感策略进行对比。为验证智能体在不同场景下的泛化能力,研究人员评估了其对包括训练集中未出现的参数在内的各类哈密顿量参数的适应性。结果表明,强化学习智能体对脉冲持续时间和初始态纯度等系统参数较为敏感,但总体展现出了良好的泛化能力,这为强化学习在量子最优控制领域的应用提供了支撑。

量科快讯