非均匀迪克量子电池充电优化的强化学习

充电优化是实现量子电池面临的关键挑战,尤其在非均匀性和部分可观测条件下。该研究采用强化学习方法来优化非均匀迪克电池的分段恒压充电策略。研究人员系统比较了四种可观测性方案下的策略表现,包括全状态访问、实验可观测参数(单个二能级系统能量)、一阶平均值以及二阶关联量。仿真结果表明,完全可观测条件下能获得接近最优且低波动的功容量,而部分可观测时若仅获取单二能级系统能量或结合一阶平均值数据,性能会显著落后于全观测基线。但通过引入二阶关联量补充部分观测数据,可将性能差距缩小94%-98%。学习得到的充电调度具有非短视特性,通过暂时性平台期或下降换取最终性能提升。这些发现为现实信息约束条件下实现高效快速充电协议提供了可行路径。
作者所在地: VIP可见
作者单位: VIP可见
提交arXiv: 2025-11-15 12:06

量科快讯