数据降维方法对量子机器学习模型有效性的影响

在该工作中,数据降维技术经常被应用于量子机器学习模型的构建过程,以解决两个关键问题:受限于噪声和有限量子比特数的NISQ(含噪声中等规模量子)器件约束,以及在经典设备上模拟大量量子比特的挑战。但这也引发了这些方法的可扩展性担忧,因为数据降维方法难以快速适应大型数据集。本文系统分析了数据缩减方法对不同量子机器学习模型的影响机制。该研究团队基于多组生成数据集、量子机器学习算法、量子数据编码方法和数据降维方法开展了对比实验,所有模型均通过准确率、精确率、召回率和F1分数等性能指标进行评估。研究结果表明,采用数据降维方法会导致性能指标值出现偏差,进而错误估计量子机器学习模型的实际性能。除降维方法外,尚有其他因素会加剧这一问题,包括数据集特征、经典-量子信息嵌入方法、特征降维比例、量子模型关联的经典组件,以及量子机器学习模型结构等。该团队发现,使用与不使用数据降维技术的模型间存在14%至48%的准确率波动区间。此外,观察还表明某些数据降维方法在特定数据嵌入方案和拟设(ansatz)结构下表现更优。

作者所在地: VIP可见
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2025-11-05 09:34

量科快讯