QAP-Router:将量子比特路由视为动态二次分配问题并采用强化学习进行求解
量子比特路由是量子编译中的一个基本问题,已被证明是NP难的。其动态特性使得局部路由决策会随时间传播并累积,从而对全局高效解决方案的求解构成挑战。现有的启发式方法依赖于有限前瞻范围的局部规则,而近期基于学习的方法通常将路由视为一个通用的序列决策问题,未能充分利用其内在结构。在本文中,我们提出QAP-Router,该方法基于一个动态二次分配问题(QAP)的公式来构建量子比特路由。通过将逻辑交互(即量子门)建模为流矩阵,并将硬件拓扑建模为距离矩阵,我们的方法将交互-距离耦合捕获到一个统一的目标函数中,该函数定义了强化学习环境中的奖励。为了进一步利用这一结构,策略网络采用了基于解感知Transformer的主干网络,将流矩阵与距离矩阵之间的交互编码到注意力机制中。我们还集成了一种与QAP框架自然融合的前瞻机制,以防止短视决策。在来自MQTBench、AgentQ和QUEKO数据集的1,831个真实量子电路上进行的大量实验表明,与现有行业编译器相比,我们的方法将路由后电路的CNOT门数量分别减少了15.7%、30.4%和12.1%。

