量子纠缠在对抗性游戏中提供了竞争优势

关于量子资源能否在完全经典的竞争环境中提供优势,这一问题尚未有定论。在竞争性零和强化学习任务中,由于成功依赖于对对抗主体间动态交互的建模(而非静态的状态-动作映射),该挑战尤为严峻。该研究团队通过受控实验,在经典量子混合智能体玩《乒乓》这款竞争性马尔可夫游戏时,分离出量子纠缠的作用。一个8量子比特的参数化量子电路作为近端策略优化框架中的特征提取器,使研究人员能直接比较采用固定纠缠门(CZ门)或可训练纠缠门(IsingZZ门)的架构与可分离电路的表现。结果表明:在参数量相当的情况下,含纠缠门的电路始终优于可分离电路;在低容量条件下,其性能达到甚至超越经典多层感知机基线。表征相似性分析进一步揭示,含纠缠电路能学习到结构独特的特征,这与改进的交互状态变量建模相吻合。这些发现确立了纠缠作为表征学习功能性资源在竞争性强化学习中的价值。
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-03-11 00:15

量科快讯