在量子计算机上实现CartPole系统的实时控制
量子强化学习(QRL)在实时控制系统中的应用面临硬件延迟、噪声敏感性和学习收敛性等方面的重大挑战。该工作针对CartPole基准测试,对一种最小化混合量子-经典智能体进行了端到端研究,以弥补理想化模拟与物理超导量子处理单元(QPU)执行之间的差距。该团队证明,即使混合智能体的训练被限制为对其量子电路组件使用参数偏移法,单量子比特智能体仍可作为有效的学习模型,在比经典演员-评论家网络少得多的回合数内解决环境问题。为将学习与部署约束联系起来,该工作映射了推理阶段控制环路速率与测量预算之间的权衡,为最终实现实时控制演示提供指导。由此产生的性能矩阵表明,推理控制频率和测量次数均显著影响平衡稳定性:更高的推理频率持续改善性能,而增加测量预算可降低实现接近最大平衡所需的最低推理频率。这些结果凸显了在测量次数与控制频率之间找到最佳平衡点的重要性,以及开发例如初态不变性电路的必要性。最后,该工作通过绕过标准高层软件栈,直接使用命令表编程Zurich Instruments读出电子设备,解决了NISQ硬件上控制延迟的关键瓶颈。这些结果量化了当前量子辅助控制的部分边界,并为实现实时闭环控制反馈所需的数十赫兹吞吐量奠定了基础。
量科快讯
1 天前
1 天前
1 天前
1 天前

