量子行走实现的空间最优臂量子识别

量子强化学习已成为将量子计算与序列决策相结合的框架,并在多臂老虎机(MAB)问题上得到应用。图老虎机问题通过引入空间约束扩展了MAB设置,但量子方法仍存在局限。该团队提出了一种用于图老虎机场景下最优臂识别的量子算法,称为“量子空间最优臂识别(QSBAI)”。该方法利用量子行走对图约束动作的叠加态进行编码,扩展了幅度放大技术,并通过Szegedy行走框架推广了量子BAI算法,从而在具有结构限制的强化学习任务与Grover型搜索之间建立联系。研究人员分析了完全图和二分图,推导出识别最优臂的最大成功概率及其对应的时间步长。该工作揭示了量子行走在加速受限环境探索方面的潜力,并拓展了量子决策算法的适用边界。

量科快讯