双重下降:神经网络量子态何时泛化?

神经量子态(NQS)为量子多体物理的数值研究提供了灵活的波函数参数化方法。尽管受到深度学习启发,但NQS与标准机器学习任务中的神经网络在多大程度上具有共同特征仍不明确。该研究团队证实NQS呈现出“双下降现象”——现代深度学习的核心特征,即泛化能力先随网络规模增大而恶化,随后在过参数化区域再次提升。值得注意的是,该工作发现第二次性能提升仅发生在远大于希尔伯特空间维度的网络规模时,表明NQS通常在欠参数化区域运行,此时增加网络规模反而会削弱泛化能力。分析显示,该区域最优网络规模取决于独特训练样本数量,这凸显了采样策略的重要性。这些发现表明,需要采用基于对称性的物理信息架构设计,而非直接套用机器学习启发式方法。

量科快讯