DiffusionHijack:针对扩散模型的供应链伪随机数生成器后门攻击及量子随机数防御

扩散模型依赖于伪随机数生成器(PRNG)来采样潜在噪声。该研究提出DiffusionHijack,一种劫持PRNG以确定性控制生成图像的供应链后门攻击。通过被植入的恶意软件包,恶意PRNG能够在不修改模型权重的情况下,强制Stable Diffusion v1.4、v1.5和SDXL完美复现攻击者选择的内容(SSIM = 1.00,N = 100次试验)。由于该攻击完全运行在神经网络计算图之外,现有模型审计和内容审核机制本质上无法检测。该攻击在随机采样(eta > 0)下仍然有效,可绕过基于CLIP的安全检测器(成功率为98-100%),且独立于用户提示词运行。作为应对措施,该工作将PRNG替换为量子随机数生成器(QRNG),后者提供信息论意义上的不可预测性。在N = 100个提示词-模型组合的测试中,QRNG防御完全消除了攻击效果,将输出相似度降至随机基线水平(SD 1.x模型SSIM < 0.20,SDXL模型SSIM < 0.45)。该工作揭示了一个此前被忽视的供应链漏洞,并为生成式AI系统提供了一种基于硬件层面的根本性缓解方案。

作者单位: VIP可见
提交arXiv: 2026-05-12 23:34

量科快讯