基于模拟VQC量子策略的实时控制初探

该论文研究了将量子计算融入离线强化学习的方法,以及由此产生的量子策略在实时控制硬件(小车倒立摆系统)中的实现。研究采用变分量子电路(VQC)作为策略表示方式,通过基于模型的经典离线策略搜索方法,使用具有可训练输入输出权重的纯VQC替代传统多层感知机构建策略网络。该工作旨在评估量子架构在现实工业控制问题中的应用潜力。实验结果表明,所研究的基于模型的离线策略搜索能够生成可稳定控制硬件倒立摆系统的量子策略。时延分析显示:虽然本地模拟执行满足实时性要求,但基于云端的量子处理速度仍无法满足闭环控制需求。

量科快讯