GaDE——面向E级计算的时间相关狄拉克方程GPU加速
由先进图形处理器(GPU)架构驱动的现代异构高性能计算(HPC)系统,能以空前性能和可扩展性加速计算进程。本研究团队推出专为分布式HPC系统优化的三维瞬态狄拉克方程GPU加速求解器——GaDE,用于模拟相对论条件下电磁场诱导的原子电子动力学。该求解器结合MPI与CUDA/HIP框架,可同时适配NVIDIA和AMD GPU架构。研究团队阐述了其实现策略:通过GPU感知MPI特性优化通信性能,使绝大部分计算在GPU上完成。在搭载AMD MI250X GPU和HPE Slingshot互连技术的准亿亿次超级计算机LUMI上评估表明,NVIDIA A100、GH200与AMD MI250X的单卡性能对比中,A100与MI250X在计算和内存带宽上表现相当,而GH200性能更优。弱扩展测试在2048块GPU上实现85%并行效率,强扩展测试则在32块GPU上获得16倍加速——对于这个通信密集型的瞬态狄拉克方程求解器而言,仍保持50%效率。这些结果证明GaDE具备极高的可扩展性,既适用于亿亿级计算系统,也能为探究相对论量子效应的超强激光实验提供预测性模拟能力。
量科快讯
6 天前
1 周前
1 周前

