基于量子计算的增强型强化学习过程合成方法
在本工作中,研究人员提出将量子强化学习(RL)作为过程综合问题的求解策略。基于该团队的先前工作,该工作开发了一个通用框架,将过程综合正式表述为马尔可夫决策过程,并引入量子增强RL算法以提升可扩展性。早期基于量子的RL在过程综合中的实现受限于量子比特需求,该需求随问题复杂性增长而扩展性较差。本工作通过引入状态编码算法将量子比特需求与问题规模解耦,从而克服了这一挑战。研究团队以经典RL求解策略作为基线,在相同训练条件下对量子算法进行基准测试。所有算法均在一个单元数量递增的流程综合问题上进行评估,以分析其性能与可扩展性。结果表明,所有方法均能在较小设计空间中识别最优流程设计。对于中等规模单元数量,与经典RL基准相比,量子方法在每回合基础上表现出竞争性性能,并在每参数基础上展现出更高的效率。本工作为未来过程系统工程中的量子计算应用奠定了基础,建立了用于比较经典与量子算法的受控基准,并表明所提出的量子变体在本工作考察的过程综合问题上仍具有竞争力。

