谁赢得安全?具有安全归因的干预感知量子预测控制

硬安全过滤器越来越多地被部署在已学习控制器的下游,以确保运行时约束的满足。然而,一个从未违反约束的过滤控制器可能仍然对安全性一无所知:过滤器可以静默地修复无能的上级策略,使得过滤后的成功反映的是过滤器本身,而非策略。该研究认为,安全的策略学习应追问安全性的归属——是策略本身还是其保护层——并使得这一问题变得可量化。该工作引入了干预感知变分量子微分预测控制(IA-VQC-DPC),该方法(i)在原始-对偶干预预算下训练一个紧凑的变分量子电路(VQC)策略,该预算会惩罚对可微控制障碍函数(CBF)投影的依赖,并且(ii)通过一个安全归属协议进行评估,该协议将执行轨迹的修正分解为CBF项和部署运行时防护项,并通过关闭防护的评估对策略进行压力测试。在闭环、高保真BOPTEST建筑控制仿真器上(5个随机种子,每种方法60个回合),干预感知训练显著降低了量子策略的原始未过滤违规次数和总安全层依赖度(两者p值均小于10^-4),且能量回归不显著;在约400个参数的同等预算下,量子策略比匹配的经典策略更安全、更舒适。关闭防护的评估证实了这种改进是策略层面的,并揭示了一个有价值的负面结果:一个已学习的可微能量头只有与分布感知的运行时防护配对时才是安全的。该归属协议具有通用性,不限于量子策略和建筑领域。

作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-06-08 17:39
访客五签:

量科快讯