用于图像分类的量子参数化自注意力网络

Transformer如今作为现代AI的核心基础设施而存在。其定义性能力——在复杂输入中动态聚焦于最相关信息——受限于自注意力评分函数的上界。量子计算凭借其叠加、纠缠和概率输出,为探索超越经典评分函数设计约束提供了根本不同的计算框架。尽管量子注意力机制已展现出初步潜力,但现有工作大多局限于重新定义特征相似性度量,而系统性地将参数化量子电路(PQC)用作评分函数的研究仍属空白;现有方案中有相当一部分依赖于纯量子架构,在含噪中等规模量子时代无法有效编码高维图像输入。该团队提出量子参数化自注意力网络(QPSAN),通过仅含每层5个可训练量子参数的PQC实现自注意力评分函数。QPSAN通过量子态编码和联合测量计算查询-键注意力分数,无需经典点积注意力的显式缩放即可生成自然有界输出。该团队进一步建立了该评分函数数学性质的理论框架,论证其捕获复杂非线性查询-键交互的潜力,并通过有效自由度分析量化编码层的结构约束。在四个视觉数据集上的实验表明,QPSAN显著优于视觉Transformer(ViT)基线,且量子表示优势随数据复杂度增加而放大。消融研究表明,性能提升可能源于量子电路的结构性归纳偏置,而非参数规模。
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-05-25 02:44

量科快讯