量子注意力机制通过重叠干涉实现:基于经典与多体量子数据的序列预测

该研究团队提出了一种基于变分量子计算的自注意力机制实现方案(QSA)——作为变换器和大型语言模型的核心运算,该机制通过构建历史数据的重叠加权组合来预测序列未来元素。与传统方法不同,该方案通过量子态重叠干涉实现必要的非线性特性,并直接以可观测量的期望值形式返回Renyi-1/2交叉熵损失,从而避免了将振幅编码预测解码为经典逻辑值的需求。该工作还创新性地设计了可训练的约束型数据嵌入方法,将量子态重叠与数据层面的相似性建立关联。研究表明QSA的门复杂度主导项为O(T d?),相较经典算法的O(T? d)具有优势,当序列长度T远大于嵌入维度d时更显实用价值。通过模拟实验,该团队验证了基于QSA的量子变换器能够有效学习经典数据序列预测任务,并在多体横场Ising量子轨迹建模中展现出性能,证实了可训练注意力机制作为量子动力学建模基础模块的实用性。

作者所在地: VIP可见
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-02-06 13:37

量科快讯