纠缠即记忆:量子语言模型的机械可解释性
量子语言模型已在序列任务中展现出竞争力,但其训练出的量子电路是否真正利用了量子资源——还是仅将经典计算嵌入量子硬件——仍属未知。此前研究仅通过终端指标评估这些模型,而未考察其内部实际学习到的记忆策略。该研究团队首次对量子语言模型开展机制可解释性研究,在受控长程依赖任务中结合了因果门消融、纠缠追踪和密度矩阵置换干预。研究发现:单量子比特模型完全可被经典模拟,且收敛于与匹配经典基线相同的几何策略;而配备纠缠门的双量子比特模型则学习到一种表征差异化的策略——其通过量子比特间纠缠编码上下文信息(经三项独立因果检验验证,p < 0.0001,d = 0.89)。在真实量子硬件上,仅有经典几何策略能抵御设备噪声;纠缠策略则退化至随机水平。这些发现将机制可解释性确立为量子语言模型科学研究的新工具,并揭示了制约学习策略实际部署的噪声-表达力权衡关系。
量科快讯
【比利时与波兰研究人员开发出可以验证任何量子态的通用方案】比利时布鲁塞尔自由大学、波兰格但斯克大学和波兰科学院的研究人员近期提出一种新的通用方案,可用于自我检测任意量子态或量子测量。据研究人员介绍,…
19 小时前
【研究人员开发的新协议可用于在大规模量子实验中重建量子态】法国格勒诺布尔阿尔卑斯大学、德国慕尼黑工业大学、德国马克斯·普朗克量子光学研究所、奥地利因斯布鲁克大学和意大利博洛尼亚大学的研究人员近期开发…
19 小时前
【超导量子计算机企业IQM获贝莱德集团5000万欧元投资】全栈超导量子计算机企业IQM昨日宣布,它已获得由BlackRock(贝莱德集团)管理的基金及账户提供的5000万欧元(约4亿元人民币)融资。…
20 小时前
20 小时前
20 小时前
1 天前
1 天前
1 天前

