量子自编码器:一种高效的量子特征图生成方法
量子机器学习方法通常依赖于固定的、手工设计的量子编码方式,这些编码可能无法为下游任务捕捉最优特征。该研究团队探索了量子自编码器在学习数据驱动的量子表征方面的效能。团队首先从理论上证明,量子自编码器方法在整个训练过程中具有高效的样本复杂度。随后,研究人员在300万条肽序列上对量子自编码器进行数值训练,并评估其在多种肽分类问题中的有效性,包括抗高血压肽预测、血脑屏障穿透性和细胞毒性活性检测等任务。 通过使用支持向量机的量子核方法,该工作将学习到的表征与基于哈密顿量演化的基线方法进行了对比。结果显示,在七个数据集上,量子自编码器学习到的表征相比哈密顿基线实现了0.4%至8.1%的准确率提升,表明其能有效泛化到多样化的下游数据集——预训练实现了无需任务特定微调的有效迁移学习。该研究证实,量子自编码器架构能以紧凑参数化(约900个参数)从大规模数据集(300万样本)中有效学习,展现了其在实际量子应用中的可行性。
