通过动作诱导表征实现解耦

学习可解释表征是变分自编码器(VAE)在表征学习领域的核心目标。其主要挑战在于如何获得解耦的表征,即每个潜在维度对应独立的生成因子。这一难题本质上与无法执行非线性独立成分分析密切相关。在此,该研究团队提出了动作诱导表征(AIR)框架,该框架通过系统可执行实验(或动作)来建模物理系统的表征。研究表明,在此框架下可严格证明表征维度相对于动作依赖性的解耦能力。团队进一步提出了变分动作诱导表征架构(VAIR),能够提取AIR从而实现标准VAE无法达成的可验证解耦。除状态表征外,VAIR还能捕捉底层生成因子的动作依赖性,直接将实验与其影响的自由度建立关联。

作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-02-06 14:42

量科快讯