博弈、赛点、量子:针对贝叶斯博弈中相关均衡的参数化量子电路

在不完全信息环境下,多智能体间的战略决策是经济学、安全以及多智能体人工智能(AI)的核心问题。在此类设定中计算均衡极具挑战性,因为联合类型-行动空间随玩家数量呈指数增长。在二元类型、二元行动的贝叶斯博弈中,对类型-行动分布的显式表示需要 O(22n) 个条目,这使得直接使用线性规划(LP)公式在中等玩家数量时内存消耗巨大。该团队提出了一种混合量子-经典框架,利用参数化量子电路(PQC)来近似贝叶斯相关均衡。PQC 使用 O(nL) 个可训练参数表示条件策略分布,其中 n 是玩家数量,L 是电路深度;在本研究考虑的最大设定中(n=10, L=2),对应 60 个可训练角度。该电路通过基于梯度的遗憾最小化进行训练,并加入了负熵正则化项以及按玩家数量设置的课程学习计划。在一个从两名到十名玩家的扑克风格贝叶斯博弈中,该求解器在所有测试的玩家数量下均实现了比 MCCFR 更低的平均截断遗憾,并且在最多八名玩家时比 DCFR 的遗憾更低,而 DCFR 在十名玩家时表现最佳。这些结果表明,紧凑的 PQC 参数化可以为近似均衡计算提供一种可行的变分表示,同时也突显了 ansatz 表达能力、优化策略以及经典模拟成本的作用。

作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-06-02 03:52

量科快讯