量子优势在多智能体强化学习中的应用
本文对量子多智能体强化学习(QMARL)中智能体协作的量子纠缠进行了实证评估。尽管QMARL近年来越来越受到关注,但大多数现有工作在没有可验证基线的情况下评估量子策略,导致无法严格区分量子优势与算法偶然性进行严格区分。该团队直接解决了这一问题,通过评估一个基于变分量子电路(VQC)智能体并共享纠缠态的分散式QMARL框架。在CHSH博弈中,经典策略的胜率理论上限为0.75,而该团队的研究表明,纠缠态QMARL智能体能够接近0.854的Tsirelson极限,这为其量子优势提供了明确证据。该团队还证明,无纠缠的量子电路与经典基线表现相当,从而性能相当,确认了起核心协调作用的是纠缠本身,而非量子电路。此外,该团队探讨了特定纠缠结构的影响,发现某些Bell态能提升协作收益,而另一些则会损害协作增益。在协作导航(CoopNav)任务中,无纠缠的QMARL在成功率上相比经典MAA2C实现了约2倍的提升(约0.85对比约0.40),其中量子智能体与经典集中式评论家搭配的混合配置表现优于全经典和全量子方案。该团队给出了实验分析,并讨论了未来工作。

