DISCOVER:一种基于物理知识的GPU加速符号回归框架

符号回归(Symbolic Regression, SR)能够从实验与模拟数据中发现可解释的数学关系。这类关系通常被称为“描述符”,其定义为与材料目标功能特性(或非期望特性)直接关联的基础材料属性。尽管现有方法如“确定独立筛选与稀疏算子”(SISSO)已成功在大型特征空间中识别出低维描述符,但多数符号回归工具与现代Python工作流兼容性差、对符号搜索空间的控制有限,或难以应对大规模研究的计算需求。本文提出的DISCOVER(基于数据驱动的变量方程回归算子组合)作为开源符号回归工具包,通过模块化、物理启发的设计应对这些挑战。该工具允许用户利用领域知识引导符号搜索,显式约束特征空间,并可选GPU加速以提升数据密集型工作流的计算效率,从而实现可复现、可扩展的符号回归流程。该软件特别适用于计算物理、计算化学和材料科学领域——这些领域对模型可解释性、物理一致性和执行时间具有严苛要求,其强调发现具有物理意义的模型,与通用符号回归框架形成互补。

作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-01-27 16:33

量科快讯