数据复杂性:经典与量子机器学习之间的界限——第一部分

量子机器学习(QML)在加速模式识别、优化和数据分析方面具有潜力,但其真正超越经典方法的条件仍不明确。现有研究多聚焦于算法和硬件,而数据本身在决定量子优势中的作用却较少受到关注。该研究团队提出,数据复杂性——包括数据集的结构性、统计性、算法性及拓扑学丰富度——是界定这些条件的核心要素。相较于量子比特数量或电路深度,真正的瓶颈在于数据嵌入、表征和泛化的成本。本文(两部曲中的第一部分)综述了经典与量子的数据复杂性度量指标,涵盖熵、相关性、可压缩性以及持续同调、拓扑纠缠熵等拓扑不变量,并探讨了它们对QML模型可训练性、扩展性和容错能力的影响。第二部分将建立统一框架,并通过跨数据集的实证基准测试,将这些复杂性度量与实际性能联系起来。
页数/图表: 登录可见
提交arXiv: 2025-09-20 04:35

量科快讯