纠缠即记忆:量子语言模型的机械可解释性

量子语言模型已在序列任务中展现出竞争力,但其训练出的量子电路是否真正利用了量子资源——还是仅将经典计算嵌入量子硬件——仍属未知。此前研究仅通过终端指标评估这些模型,而未考察其内部实际学习到的记忆策略。该研究团队首次对量子语言模型开展机制可解释性研究,在受控长程依赖任务中结合了因果门消融、纠缠追踪和密度矩阵置换干预。研究发现:单量子比特模型完全可被经典模拟,且收敛于与匹配经典基线相同的几何策略;而配备纠缠门的双量子比特模型则学习到一种表征差异化的策略——其通过量子比特间纠缠编码上下文信息(经三项独立因果检验验证,p < 0.0001,d = 0.89)。在真实量子硬件上,仅有经典几何策略能抵御设备噪声;纠缠策略则退化至随机水平。这些发现将机制可解释性确立为量子语言模型科学研究的新工具,并揭示了制约学习策略实际部署的噪声-表达力权衡关系。
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-03-27 14:57

量科快讯