自适应非局域可观测量量子强化学习

混合量子-经典框架利用量子计算进行机器学习;然而,变分量子电路(VQC)受限于需要局部测量的要求。该研究团队在量子强化学习(QRL)中引入了一种自适应非局域可观测量(ANO)范式,联合优化电路参数和多量子比特测量。ANO-VQC架构作为深度Q网络(DQN)和异步优势演员-评论家(A3C)算法中的函数逼近器。在多项基准任务中,ANO-VQC智能体表现优于基线VQC。消融研究表明,自适应测量在不增加电路深度的情况下扩展了函数空间。该工作结果表明,自适应多量子比特观测量可在强化学习中实现实用的量子优势。

量科快讯