将多智能体路径规划建模为QUBO问题

多智能体路径规划旨在选择车辆(每辆车对应一条预设路线),以提高道路网络的空间覆盖率,同时限制冗余重叠。该研究团队首先给出了形式化问题定义,通过加权集合包装问题的归约证明了该问题的NP难特性,并推导出可直接编码唯一覆盖奖励与成对重叠惩罚系数的二次无约束二进制优化模型。其中单个惩罚参数控制着覆盖率与重叠度的平衡关系。研究人员区分了支持多目标探索的“软惩罚模式”与能强制实现近乎无重叠路线的“硬惩罚模式”。该工作详细描述了城市实例生成、候选路径构建、QUBO矩阵建立的实际流程,并分别采用精确混合整数求解器(Gurobi)、模拟退火算法及D-Wave混合量子退火算法进行求解。在包含多达10,000辆车的巴塞罗那实例实验中,该团队发现了明显的覆盖率-重叠度拐点,证明帕累托最优解主要出现在硬惩罚模式下;当问题规模扩大时,D-Wave混合求解器与Gurobi在目标函数值上基本一致,仅存在微小运行时差异。

作者单位: VIP可见
提交arXiv: 2026-02-08 11:18

量科快讯