纠缠即记忆:量子语言模型的机械可解释性
量子语言模型已在序列任务中展现出竞争力,但其训练出的量子电路是否真正利用了量子资源——还是仅将经典计算嵌入量子硬件——仍属未知。此前研究仅通过终端指标评估这些模型,而未考察其内部实际学习到的记忆策略。该研究团队首次对量子语言模型开展机制可解释性研究,在受控长程依赖任务中结合了因果门消融、纠缠追踪和密度矩阵置换干预。研究发现:单量子比特模型完全可被经典模拟,且收敛于与匹配经典基线相同的几何策略;而配备纠缠门的双量子比特模型则学习到一种表征差异化的策略——其通过量子比特间纠缠编码上下文信息(经三项独立因果检验验证,p < 0.0001,d = 0.89)。在真实量子硬件上,仅有经典几何策略能抵御设备噪声;纠缠策略则退化至随机水平。这些发现将机制可解释性确立为量子语言模型科学研究的新工具,并揭示了制约学习策略实际部署的噪声-表达力权衡关系。
量科快讯
2 小时前
【瑞士EPFL科研团队成功实现在光子芯片商集成超快激光器】瑞士洛桑联邦理工学院(EPFL)的一个研究团队近日在《自然》杂志上发表研究成果,他们首次在光子芯片上集成了可媲美台式飞秒激光器的超快激光器,…
2 小时前
【是德科技ADS光子设计器新增对格芯硅光子工艺技术的支持】Keysight(是德科技)近日宣布,其先进设计系统(ADS)光子设计器已新增对GlobalFoundries(格芯)硅光子工艺技术的支持,…
6 小时前

