用于图像分类的混合视觉变换器与量子卷积神经网络

量子机器学习(QML)虽具备计算优势潜力,但现实任务的进展受限于经典预处理过程和噪声设备。该研究团队提出ViT-QCNN-FT混合框架,将微调的视觉Transformer与量子卷积神经网络(QCNN)结合,将高维图像压缩为适用于含噪声中等规模量子(NISQ)设备的特征。通过系统性探究纠缠现象,研究人员发现具有均匀分布纠缠熵的拟设持续提供卓越的非局部特征融合能力,并实现当前最优精度(CIFAR-10数据集达99.77%)。令人惊讶的是,量子噪声展现出双重作用:在某些情况下甚至能提升精度(振幅阻尼环境下+2.71%)。更显著的是,用参数数量相当的经典网络替代QCNN会导致性能骤降29.36%,这为量子优势提供了明确证据。该工作为经典与量子架构的协同设计确立了原则性路径,指向能够解决复杂高维学习任务的实用化QML发展方向。

作者所在地: VIP可见
提交arXiv: 2025-10-14 08:52

量科快讯