高性能量子模拟的低层级与NUMA感知优化

可扩展的量子电路经典模拟技术,对于推动量子算法研发与硬件验证至关重要。该研究工作通过单节点系统的精细化底层调优实现性能突破,不仅提升了经典量子模拟的性能表现,更为构建可扩展的异构实现方案奠定基础——这些方案最终可能弥合经典模拟与无噪声量子计算之间的鸿沟。尽管已有文献报道过类似的底层优化尝试,但因未开源相关实现代码,阻碍了独立验证与后续开发。该团队为QuEST模拟器开发了开源高性能扩展模块,将最先进的底层优化与非统一内存访问(NUMA)技术引入现代计算机系统,其技术亮点包括:基于数据本地化的计算策略、NUMA感知内存分配、线程绑核、AVX-512向量化、激进循环展开及显式内存预取等硬件级优化。实验数据显示显著加速效果——单量子比特门操作提升5.5-6.5倍,双量子比特门提升4.5倍,随机量子电路(RQC)提速4倍,量子傅里叶变换(QFT)加速1.8倍,证实了严格性能调优可大幅拓展经典量子模拟器在当前硬件上的实际运算能力。

量科快讯