重新思考如何行动:面向分布式量子系统中基于强化学习的电路路由的动作空间工程

随着单片扩展量子处理器变得越来越困难,分布式量子计算(DQC)通过将量子比特分布在多个互联的小型量子处理器模块中,提供了一种替代方案。在这种架构下,量子电路编译的挑战从在单个模块内放置和路由量子比特,转变为跨模块高效地放置、路由和使用量子比特。为了优化电路执行时间,必须找到正确的依赖于状态的网络决策,例如何时何地生成共享的远程量子态以支持远程操作。强化学习(RL)为该问题提供了一个自然的框架,能够生成可泛化到不同电路的编译策略。该团队基于Promponas等人(2024)的工作框架,引入了一种智能体,该智能体将一种新颖的动作空间公式与有效的动作掩码策略相结合。在不同耦合约束下对这两种方法进行的全面数值比较表明,该团队提出的智能体在训练和推理性能上均有所提升,建模的执行时间相对减少了高达35%。
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-05-04 09:32

量科快讯