StabilizerBench:量子纠错电路合成AI辅助基准测试平台
随着量子硬件迈向容错运行阶段,对正确量子纠错(QEC)电路的需求已远超人工设计能力。人工智能代理为自动化这一合成过程提供了可行路径,但目前缺乏专门衡量其在生成QEC电路方面进展的基准测试。该研究团队推出StabilizerBench基准套件,包含跨越12个家族、4-196个量子比特、距离为2-21的192个稳定子码,并按难度递增分为三项任务:态制备电路生成、语义约束下的电路优化,以及容错电路合成。 尽管以QEC为出发点,稳定子电路训练了通用量子编程所需的核心能力,包括门分解、量子比特路由和语义保持转换,同时通过Gottesman-Knill定理实现高效验证,使得基准测试能扩展到大型编码而无需承担完全酉矩阵比较的指数级成本。该工作定义了两级统一生成器加权评分系统:衡量成功广度的能力得分,以及捕捉电路优点的质量得分。还引入了连续性容错和优化指标,用于评估误差容限和电路改进程度,而非简单的二元通过/失败判定。 借鉴SWE-bench等经典基准设计理念,StabilizerBench规范了输入、验证机制和评分标准,但保留提示策略和代理方法的开放性。研究人员评估了三种前沿AI代理,发现该基准能有效区分模型与任务表现,同时显示出显著的改进空间。

