大型语言模型在代码片段迁移至后量子密码学中的实证评估
向抗量子密码(PQC)的迁移不仅需要替换易受攻击的密码学原语,还需要重构其周边的软件逻辑。尽管现有的PQC迁移框架提供了组织层面的指导,但实际代码级别的修复工作在很大程度上仍依赖人工操作且容易出错。本文评估了大语言模型(LLMs)是否可以被训练,以协助将前量子密码代码片段迁移为对应的后量子密码版本,同时保持功能正确性。为此,该团队构建了一个可复现的实验框架,该框架基于一个包含800个配对的Python代码片段合成数据集,涵盖六个密码学家族以及多种原语组合的案例。每个配对均通过类别特定的功能测试进行验证,从而实现数据集质量控制以及对模型生成迁移结果的客观评估。共评估了四个模型:零样本场景下的GPT-4.1,以及经过微调的GPT-3.5-turbo、GPT-4.1-mini和CodeLlama-7B-Instruct版本。结果表明,面向特定领域的微调对于可靠的密码学迁移至关重要。微调后的GPT-4.1-mini模型取得了最佳整体性能,其平均静态相似度为0.9072,动态功能正确率为92.5%,显著优于零样本基线。对六个开源代码仓库的补充验证进一步表明,该方法能够在局部密码学模块中生成有用的迁移代码,同时也揭示了在具有复杂依赖关系和跨模块交互的大型项目中存在的局限性。这些研究发现表明,只要配合自动验证与依赖感知的校验,经过微调的大语言模型可以在未来的密码敏捷迁移流水线中发挥实用价值。

