Q-SpiRL: 基于量子脉冲强化学习的自适应机器人导航
动态环境下的自适应机器人导航需要能够在可靠到达目标的同时生成高效且稳定轨迹的策略。本文提出Q-SpiRL——一种用于避障机器人导航的量子脉冲强化学习框架。该框架开发并评估了五种智能体家族:表格型Q学习、经典MLP、经典SNN、量子增强MLP(QMLP)和量子增强脉冲神经网络(QSNN)。所有模型均在统一的训练与评估流程下实现,其中QSNN是核心架构,因为它将基于脉冲的时间处理与变分量子特征变换相结合。实验在三种规模递增的网格世界环境中进行,分别为20x20、30x30和40x40,包含静态与动态障碍物。性能评估采用确定性推理下的成功率、成功加权路径长度、路径长度和转弯率。结果表明,QSNN在任务完成度、轨迹效率和运动平滑性之间实现了最强的整体权衡,在最具挑战性的设置中成功率高达99%,同时保持了较高的路径效率。在IBM量子硬件上的执行进一步证明了该混合策略在实际设备条件下部署的可行性。

