动态环境中的量子强化学习

将振幅放大形式的量子计算技术与经典强化学习相结合,催生了所谓的“量子可访问强化学习混合智能体”,该技术在特定学习问题中实现了样本复杂度的二次加速。目前,这种混合智能体仅应用于静态学习问题,即马尔可夫决策过程组分不随时间变化的场景。该工作探索了混合智能体在动态强化学习环境中的适用性,通过引入耗散机制增强其性能,并让改进后的学习智能体在具有时变奖励函数的强化学习环境中与经典强化学习智能体进行实证对比。研究表明,改进后的混合智能体能够快速适应环境变化,较经典版本展现出更高的平均成功率。

量科快讯