多GPU量子电路模拟及网络性能的影响

正如量子计算的根本目标所固有的特性,经典计算机对量子算法的模拟在资源需求方面历来极高。尽管如此,模拟对该领域的成功至关重要,也是算法开发验证及硬件设计的必备环节。GPU加速已成为模拟的标准实践,由于经典方法固有的指数级扩展特性,实现具有代表性的系统规模可能需要多GPU模拟。此时,GPU间通信可能成为性能瓶颈。该工作将MPI引入QED-C面向应用的基准测试套件,以支持高性能计算系统上的基准测试。研究团队回顾了互连技术的进展及多GPU通信API,并通过多种互连路径进行测试,包括近期推出的NVIDIA Grace Blackwell NVL72架构——这是首款实现跨节点高带宽GPU专用互连的商业产品。结果表明:尽管GPU架构改进使近几代产品获得超4.5倍加速,但互连性能进步的影响更为显著,多GPU模拟的求解时间实现了超16倍的性能提升。

作者所在地: VIP可见
作者单位: VIP可见
提交arXiv: 2025-11-18 16:40

量科快讯