通过量子自编码器防御量子分类器对抗性扰动
机器学习模型可以通过学习数据样本来高效执行各种任务。当数据样本受到对抗性操纵时(例如插入精心设计的噪声),可能导致模型出错。量子机器学习模型同样容易受到此类对抗性攻击的影响,尤其是在使用变分量子分类器进行图像分类时。尽管已有针对对抗性扰动的有效防御方法(如使用对抗样本训练),但这些方法面临实际限制。例如,在无法使用对抗样本训练或可能导致模型对特定攻击类型过拟合的场景中,这些方法并不适用。本文提出了一种无需对抗训练的防御框架,该框架利用量子自编码器通过重构来净化对抗样本。此外,该防御框架还提供了一种置信度指标,用于识别量子自编码器无法净化的潜在对抗样本。大量评估表明,在对抗性攻击下,该防御框架的预测准确率可显著超越现有最先进方法(最高提升68%)。

