在PySCF中实现GPU加速的多网格高斯平面波算法

该研究团队提出了一种基于GPU加速的多重网格高斯-平面波密度拟合(FFTDF)方法,用于在Kohn-Sham密度泛函理论框架下高效构建Fock矩阵并计算核梯度,该方法已实现在PySCF软件的GPU4PySCF模块中。该工作的CUDA核函数采用基于网格的并行化策略来收缩高斯基函数对,在NVIDIA GPU上实现了高达FP64峰值性能80%的计算效率,且对高角动量(最高至f壳层)函数仍保持同等效率。对多达1536个原子和20480个基函数的分子与固体体系进行基准测试表明,相较于28核共享内存节点的CPU实现,H100 GPU可带来最高25倍的加速。对于包含256个水分子的团簇体系,单块H100 GPU仅需约30秒即可完成基态能量与核梯度计算。该开源实现为诸多应用(如从头算分子动力学和高通量计算)提供了基础支撑。

作者单位: VIP可见
提交arXiv: 2026-03-25 23:53

量科快讯