剖析量子强化学习:关键组件的系统性评估

基于参数化量子电路(PQC)的量子强化学习(QRL)已成为量子计算与强化学习(RL)交叉领域的前沿范式。尽管PQC在设计上构建了量子-经典混合模型,但其实际应用仍受限于训练不稳定性、贫瘠高原(BP)现象以及难以量化各组件独立贡献等问题。该工作通过系统性实验评估了三个关键要素:(i)采用数据重上传(DR)等先进策略的数据嵌入方法;(ii)量子线路设计中纠缠效应的作用;(iii)量子测量后处理模块,特别是尚未充分探索的输出复用(OR)技术。研究团队在统一的PPO-CartPole框架下,对混合智能体与经典智能体进行同等条件对比。结果表明:OR技术虽属经典范畴,却在混合系统中呈现独特行为;DR显著提升了训练可行性与稳定性;而过强纠缠会抵消经典优化优势。这些发现为量子与经典组件的协同机制提供了可控实验证据,并建立了可复现的QRL系统基准测试与组件分析方法框架。
作者单位: VIP可见
提交arXiv: 2025-11-21 10:21

量科快讯