抗退相干与时变条件下量子网络路由的鲁棒信念状态策略学习

这篇论文提出了一种基于特征的部分可观测马尔可夫决策过程(POMDP)框架,用于量子网络路由。该框架将信念状态规划与图神经网络(GNNs)相结合,以应对动态量子系统中的部分可观测性、退相干性和可扩展性挑战。该研究团队的方法将复杂的量子网络动态(包括纠缠退化和时变信道噪声)编码到低维特征空间,从而实现高效的信念更新和可扩展的策略学习。 该框架的核心是一个混合GNN-POMDP架构,该架构通过处理纠缠链路的图结构表示来学习路由策略,并结合噪声自适应机制,将POMDP信念更新与GNN输出融合以实现稳健决策。研究人员提供了理论分析,确立了信念收敛、策略改进和噪声鲁棒性的保证。在多达100个节点的模拟量子网络上进行的实验表明,与现有最先进的基线方法相比,该框架在路由保真度和纠缠传输率方面有显著提升,特别是在高退相干和非平稳条件下表现尤为突出。

量科快讯