学徒学习量子算法

学徒学习是一种常用于训练人工智能系统执行任务的方法,这些任务难以通过传统方法直接明确规范。基于Abbeel和Ng(ICML”04)的研究,该团队提出了一种通过逆向强化学习实现学徒学习的量子算法。作为中间步骤,研究人员提供了一种经典近似学徒学习算法,以展示其量子算法获得的速度提升。该工作证明了经典近似算法的收敛性保证,这一保证也适用于量子学徒学习算法。研究还表明,与经典算法相比,该量子算法在特征向量维度(k)和动作空间规模(A)上实现了每轮迭代时间复杂度平方级的改进。

量科快讯