面向连续时间车辆控制的李雅普诺夫感知量子启发强化学习:可行性研究
该论文提出了一种新型的基于李雅普诺夫的量子强化学习(LQRL)框架,将量子策略优化与李雅普诺夫稳定性分析相结合,用于连续时间车辆控制。该工作创新性地将变分量子电路(VQCs)的表征能力与稳定性感知策略梯度机制相融合,确保动态环境下系统的渐近收敛和安全决策。研究人员将车辆纵向控制问题建模为连续状态强化学习任务,其中量子策略网络在满足李雅普诺夫稳定性约束条件下生成控制动作。仿真实验在闭环自适应巡航控制场景中进行,采用稳定性反馈训练的量子启发策略。结果表明,LQRL框架成功将李雅普诺夫稳定性验证嵌入量子策略学习过程,实现了可解释且稳定性感知的控制性能。尽管在激进加速工况下观察到瞬态超调与李雅普诺夫函数发散现象,系统仍保持有界状态演化,验证了在量子强化学习架构中集成安全保证的可行性。该框架为自动驾驶系统和混合量子经典优化领域中可证明安全的量子控制奠定了理论基础。
量科快讯
【牛津大学开设量子技术理学硕士课程 首批有29名学生入学】英国牛津大学新开设的量子技术理学硕士课程已于近日正式启动。首批有29名学生入学,他们将率先受益于这一面向快速发展的量子技术领域的跨学科培训课…
19 小时前
1 天前
2 天前
2 天前
2 天前



