并行化变分量子本征求解器:从即时编译到多GPU扩展

变分量子本征求解器(VQE)是一种用于计算分子系统基态能量的混合量子-经典算法。该研究团队基于配备4×NVIDIA H100 GPU(每张80GB)的高性能计算集群,利用PennyLane量子计算框架,实现了氢分子(H2)在100个键长范围内的势能面计算。研究提出包含四个阶段的系统并行化方案:(1)优化器与即时编译加速实现4.13倍加速;(2)GPU设备加速在4量子比特时达到3.60倍加速,26量子比特时扩展至80.5倍;(3)MPI并行化实现28.5倍加速;(4)多GPU扩展在4张H100 GPU上实现3.98倍加速,并行效率达99.4%。综合优化使H2势能面计算总加速比达到117倍(593.95秒→5.04秒)。通过4至26量子比特的CPU-GPU扩展研究表明,GPU在所有规模上均具优势,加速比介于10.5至80.5倍之间。多GPU基准测试显示近乎完美的扩展性(99.4%效率),并证实单张H100 GPU在达到内存限制前可模拟最多29个量子比特。优化后的实现将运行时间从近10分钟缩减至5秒,实现了可交互的量子化学探索。

作者所在地: VIP可见
作者单位: VIP可见
提交arXiv: 2026-01-15 00:21

量科快讯