大规模语言模型采样与量子随机数防御的种子劫持
大型语言模型(LLMs)依赖确定性伪随机数生成器(PRNGs)进行自回归采样,这一机制构成了现有防御体系未能覆盖的关键供应链攻击面。本研究提出SeedHijack后门攻击方法,通过操控PRNG输出强制攻击者指定令牌的选择,且无需修改模型logits。在针对GPT-2(124M)的540次试验基准测试中,该攻击在9种采样配置下实现了99.6%的精确令牌注入成功率;在四个对齐模型(1.5B-7B,涵盖RLHF/SFT/推理蒸馏)上达到100%成功率,并突破了本工作中测试的所有对齐方法。研究进一步提出基于硬件量子随机数生成器(QRNG)的防御方案,在评估威胁模型下该方案可消除攻击影响,且中位数开销极低(延迟增加+0.6%,内存增加+7.7 MB)。本工作揭示了关键的采样层漏洞,并提供了一种实用可部署的QRNG防御方案。
量科快讯
【神户大学新研究利用更精细的数学来区分量子材料与传统材料】神户大学的一个研究团队近日在《物理评论B》上发表新论文,重新审视了平面霍尔效应作为探测特殊量子性质工具的可靠性。该团队通过更精细的数学分析发…
27 分钟前
【欧盟量子旗舰计划将于6月启动系列研讨会,聚焦五大路线图】欧盟量子旗舰计划昨日宣布将启动第二轮公开在线研讨会,以支持其《战略研究与产业议程》(SRIA)及相关路线图的更新工作。作为“量子欧洲战略”路…
21 小时前
22 小时前
1 天前
【大阪大学制备的钴蜂窝状磁性薄膜或催生低成本量子计算技术】日本大阪大学产业科学研究所(SANKEN)的研究人员与合作机构近日在《物理评论材料》上发表一项研究,成功制备出一种特殊薄膜材料,其中钴原子在…
1 天前
1 天前

