GaDE——面向E级计算的时间相关狄拉克方程GPU加速
由先进图形处理器(GPU)架构驱动的现代异构高性能计算(HPC)系统,能以空前性能和可扩展性加速计算进程。本研究团队推出专为分布式HPC系统优化的三维瞬态狄拉克方程GPU加速求解器——GaDE,用于模拟相对论条件下电磁场诱导的原子电子动力学。该求解器结合MPI与CUDA/HIP框架,可同时适配NVIDIA和AMD GPU架构。研究团队阐述了其实现策略:通过GPU感知MPI特性优化通信性能,使绝大部分计算在GPU上完成。在搭载AMD MI250X GPU和HPE Slingshot互连技术的准亿亿次超级计算机LUMI上评估表明,NVIDIA A100、GH200与AMD MI250X的单卡性能对比中,A100与MI250X在计算和内存带宽上表现相当,而GH200性能更优。弱扩展测试在2048块GPU上实现85%并行效率,强扩展测试则在32块GPU上获得16倍加速——对于这个通信密集型的瞬态狄拉克方程求解器而言,仍保持50%效率。这些结果证明GaDE具备极高的可扩展性,既适用于亿亿级计算系统,也能为探究相对论量子效应的超强激光实验提供预测性模拟能力。
量科快讯
14 小时前
15 小时前
1 天前
【新研究表明利用纠缠原子云进行量子测量可实现更高测量精度】瑞士巴塞尔大学与法国巴黎卡斯特勒–布罗塞尔实验室(LKB)的研究人员最近合作证明,空间上分离的量子物体之间的纠缠不仅可实现,还能够用于同时高…
1 天前
4 天前

