量子启发的自注意力机制在大语言模型中的应用 | 量子科技中心_量科网

量子启发的自注意力机制在大语言模型中的应用

ArXiv预印本仅供参考 2026-03-06 11:54

参考来源 ➔ 下载PDF ➔

自然语言处理领域的最新进展主要由基于Transformer架构的模型推动，这类架构高度依赖自注意力机制来建模序列中标记之间的关系。同样，量子自然语言处理领域——旨在利用量子原理解决语言理解与生成任务中的挑战——近期也出现了量子自注意力机制的研发成果。该研究团队提出了一种经典量子启发的自注意力机制(QISA)，并将其集成到GPT-1完整的自回归语言建模流程中。据我们所知，这是此类机制的首次集成应用，因为先前的量子自注意力机制主要仅在文本分类任务中进行过测试。实验结果表明，在字符错误率(提升15.5倍)、单词错误率(提升4.7倍)和交叉熵损失(提升13倍)等指标上，QISA机制相比标准自注意力机制展现出更优性能，且仅需付出2.6倍的推理时间代价。

作者单位： VIP可见

页数/图表： 登录可见

提交arXiv： 2026-02-09 18:59

量科快讯

【Quantum Computing Inc.即将部署下一代光子储层计算平台NeuraWave】Quantum Computing Inc.近日宣布，其下一代光子储层计算平台NeuraWave现已可部署使用。该平台专为在边缘端实现更快、…

19 小时前

【莱布尼茨超算中心实测Q.ANT光子处理器可显著提升数据中心能效】德国莱布尼茨超算中心（LRZ）近期在日常运行环境中对Q.ANT的光子处理器进行了测试，结果显示出良好前景。LRZ表示，其研究团队对Q.ANT…

19 小时前

【南加州大学新研究：材料对光的响应取决于电子在材料内部的组织结构】在材料科学中，理解材料的“纹理”，即其内部结构如何形成并发生变化，是实现材料行为设计与调控的重要基础。美国南加州大学研究人员进行的最新研究表…

20 小时前

【MIT开发出超高能效微芯片可将后量子密码技术引入至无线医疗设备中】美国麻省理工学院（MIT）的研究人员开发出一种超高能效微芯片，可将后量子密码学技术应用于无线生物医疗设备，包括心脏起搏器和胰岛素泵。此前，可…

20 小时前

【Q-CTRL的Fire Opal软件已原生集成至IonQ的量子处理器中】Q-CTRL与IonQ近日宣布，双方已将Q-CTRL的Fire Opal软件原生集成至IonQ的量子处理器中，以提升量子计算性能。此次集成将…

20 小时前

【日本东北大学团队借力人工智能模型，实现量子点电荷跃迁线自动提取】半导体自旋量子比特被认为是下一代量子计算机的有力候选方案，主要原因在于其在可扩展集成以及与现有半导体技术的兼容性方面具有较高潜力。最近，来自…

20 小时前

【思科公司发布通用量子交换机解决了构建量子网络的最基础障碍】思科公司日前发布了一款通用量子交换机，被认为是量子网络领域的一个重要进展，它解决了构建量子网络过程中的一个最基础障碍。据思科称，该设备作为一…

21 小时前

【新研究表明GPU驱动的超级计算机可解决量子化学中的高难度计算任务】来自英伟达、SandboxAQ、匈牙利科学院维格纳物理研究中心、德国慕尼黑工业大学高等研究院以及美国太平洋西北国家实验室的研究人员合作开展的…

21 小时前

【Zapata Quantum完成1500万美元超额融资为期一年的重组工作已结束】量子计算应用与算法开发公司Zapata Quantum日前宣布完成一轮1500万美元的超额认购融资。本轮融资由Triatomic Capit…

21 小时前

【TreQ部署上线采用开放架构的量子计算测试平台】英国量子系统工程与制造公司TreQ已完成其开放架构量子（OAQ）测试平台的设计和建设，这是一套多供应商系统，已投入上线运行。该系统是Inno…

22 小时前

【Classiq推出可显著加速量子软件开发的新AI智能体】量子计算软件公司Classiq近日宣布，推出一项可显著加速量子软件开发的新AI智能体层。该层由第一代专家级量子智能体驱动，使用户能够从自然语…

22 小时前

【光子计算先驱Q.ANT设立美国总部，前IBM高管出任首席技术官】德国商用光子计算先驱Q.ANT公司近日宣布，它已在美国德克萨斯州奥斯汀市设立美国总部，并任命半导体行业资深人士Bruno Spruth为首席…

22 小时前

【美国亚利桑那州发布凤凰城量子战略，以推动区域未来经济增长】美国亚利桑那州凤凰城正全力发展量子计算以迈向未来经济，并已委托亚利桑那州立大学发挥领导作用。凤凰城市长Kate Gallego在日前的市情咨…

22 小时前

【华盛顿大学研究人员利用量子电路对亚原子粒子碰撞过程进行了模拟】美国华盛顿大学的一个研究团队利用量子模拟对亚原子粒子碰撞过程进行了建模，为理解高能物理中的强子碰撞提供了新的研究路径。在该研究中，团队通过量…

1 天前

【英飞凌科技作为核心工业合作伙伴参与欧洲三个量子试点产线项目】Infineon（英飞凌）科技日前表示，其作为核心工业合作伙伴，将参与推动欧洲向实用化并最终实现商业可行的量子计算发展，并为三个量子试点产线…

1 天前

【量子技术初创公司QMatter完成120万美元前种子轮融资】量子技术初创公司QMatter宣布完成120万美元前种子轮融资，由全球最大的纯量子基金55 North领投，XTX Ventures、Bel…

3 天前

【德国慕尼黑大学开发的新方法有望为高温超导机制研究提供新见解】德国慕尼黑大学（LMU）的研究团队提出一种新方法，可突破基本分辨率限制，并有望为高温超导机制研究提供新的见解。据了解，该方法可用于计算复杂量…

3 天前

【ICFO研究人员找到在高次谐波产生过程中调控光量子态的新方法】西班牙巴塞罗那光子科学研究所（ICFO）的研究人员提出了一种用于高次谐波产生过程中调控光量子态的新方法，该方法使研究人员能够在极紫外（XUV…

3 天前

【IonQ发布面向可扩展、容错量子计算的完整全栈构建蓝图】IonQ日前发布了一份面向可扩展、容错量子计算的完整全栈可构建蓝图，用于实现可规模化的容错量子计算系统。该技术论文给出了其面向容错量子计算的…

3 天前

【PINQ²成为Pasqal中性原子量子技术在加拿大的独家经销商】加拿大数字与量子创新平台PINQ²日前宣布，它已成为Pasqal公司中性原子量子计算技术在加拿大的独家经销商。得益于DistriQ从Pasq…

3 天前

【QC Design推出Gauge工具可高效评估各类解码策略下的最佳纠错阈值】QC Design公司日前宣布推出Gauge，这是其Plaquette平台的一个扩展工具，用于在特定量子纠错编码与噪声模型下评估最优容错阈值…

3 天前

【英国量子脑扫描仪开发商Cerca Magnetics完成380万英镑A轮融资】英国量子脑扫描仪开发商Cerca Magnetics近日宣布完成380万英镑（约3500万元人民币）A轮融资，投后估值为3000万英镑（约2…

3 天前

【宾夕法尼亚州七所大学联合多家机构发起成立Keystone AI+量子工厂】宾夕法尼亚州七所研究密集型大学联合匹兹堡超算中心、宾夕法尼亚州政府以及Team Pennsylvania共同发起成立了Keystone AI…

3 天前

【东芝开发出紧凑型QKD发射与接收系统并演示QKD卫星与地面光纤网络互联】在量子密码通信领域，东芝公司开发了一套快速且紧凑的量子密钥分发（QKD）发射与接收系统，以用于通过卫星实现长距离QKD的实际应用。最近，该系…

3 天前

【科罗拉多量子孵化器正开发全美首个开放式量子定时技术验证测试平台】科罗拉多量子孵化器（COQI）昨日宣布，它正在开发全美首个可开放访问、商用化的第三方量子定时技术验证测试平台。据悉，一旦投入使用，该测试平台…

3 天前

【Quantinuum向美国证券交易委员会秘密提交IPO注册声明草案】Honeywell公司宣布，其控股公司Quantinuum已于2月17日向美国证券交易委员会（SEC）秘密提交Form S-1注册声明草案，…

3 天前

【慕尼黑大学研究人员攻克了钙钛矿量子点研究中的两大挑战】钙钛矿量子点被视为LED、光催化及未来量子光源领域的潜力材料。慕尼黑大学（LMU）的研究人员最近成功攻克了这类量子点研究中的两大难关：其在溶…

3 天前

【加拿大量子工业联盟将于5月下旬举办量子技术与防务安全论坛】加拿大量子工业（QIC）联盟宣布将于5月25日在渥太华举办“QUANTUM NOW | DEFSEC”论坛。这是一场为期一天的高级别高管论坛…

3 天前

【量子硬件公司Equal1与量子算法开发商Kvantify建立战略联盟】Equal1与Kvantify近日宣布达成合作，与通过整合各自的技术优势与专业能力，共同应对全球最复杂的科学与工业挑战，推动量子应用在药物发…

3 天前

【德国航空航天中心Climate QML项目旨在利用机器学习与量子计算提升气候模型性能】Climate QML项目的研究人员最近介绍了德国航空航天中心（DLR）如何利用机器学习与量子计算机，在数据高度混沌的湍流区域精准减少分析误…

3 天前