最后一英里按需配送的量子高效强化学习解决方案
量子计算为解决NP难组合优化问题提供了一种极具前景的新途径。特别是在优化领域,传统方法难以处理大规模解决方案的计算复杂度。该研究团队针对具有时间窗约束的大规模带容量取送货问题(CPDPTW),设计了一种融合参数化量子电路(PQC)的强化学习框架,以最小化现实场景中最后一公里即时配送的运输时间。研究人员提出了一种创新的问题专用编码量子电路结构,包含纠缠层和变分层设计。通过数值实验,该工作对比了近端策略优化(PPO)与量子奇异值变换(QSVT)方法,结果表明所提方法在解决方案规模、训练复杂度及实际约束条件兼容性方面均展现出显著优势。
