是我,量子马里奥:多芯片集成下的可扩展量子强化学习

量子强化学习(QRL)有望通过希尔伯特空间的强大表征能力实现紧凑的函数逼近器,但其实际发展受到噪声中等规模量子(NISQ)时代限制因素的阻碍,如量子比特数量有限和噪声累积。该研究团队提出了一种采用多个小型量子卷积神经网络(QCNN)的多芯片集成框架来突破这些限制。该方法将《超级马里奥兄弟》游戏环境中复杂的高维观测数据分配到独立的量子电路中处理,随后在双深度Q网络(DDQN)框架内对输出结果进行经典聚合。这种模块化架构使得量子智能体首次能够处理复杂环境中的QRL任务,相较于经典基准模型和单芯片量子模型,展现出更优的性能和学习稳定性。多芯片集成方案通过减少降维过程中的信息损失增强了可扩展性,同时仍可在近期量子硬件上实现,为QRL应用于现实问题提供了可行路径。

量科快讯