基于OpenACC的GPU加速学习误差密钥封装机制在后量子密码学中的应用

Shor算法证明,在拥有大规模量子计算机的世界中,基于整数分解和离散对数问题的非对称加密协议不再安全。因此,后量子密码学(PQC)在过去几年间得到发展,旨在寻找能够抵御量子攻击的密码学原语。PQC方案所依赖的主要困难问题之一是带误差学习(LWE)问题,其计算密集程度远超其经典前身。在该工作中,该团队提出了一种基于标准LWE的密钥封装机制(KEM),并利用OpenACC开发了面向GPU的实现方案。该研究从求解时间与能耗两方面评估了加速应用的性能,考虑了在多种NVIDIA GPU型号与代际上的裸机和容器化执行场景。该实现方案在所有测试的GPU平台上均实现了显著加速。特别是在NVIDIA Grace Hopper超级芯片上,相较于多线程CPU基线实现了高达208倍的加速比,并能够执行在CPU架构上因内存与同步约束而不可行的问题规模。能耗分析还显示,与配备x86 CPU和NVIDIA H100 GPU的系统相比,使用该超级芯片时效率提升了约2倍。这些结果凸显了GPU加速对计算密集型的LWE密码学工作负载的有效性。

作者单位: VIP可见
提交arXiv: 2026-05-31 05:01

量科快讯