STEMGym:在自主电子显微镜中剂量预算下的序列决策基准测试

自主科学成像的一个核心前提是,更智能的导航——无论是贝叶斯、基于强化学习还是其他自适应方式——是实现样本高效采集的主要杠杆。该研究在扫描透射电子显微镜(STEM)中提出了相反的证据,这是一种原子分辨率成像方式,其每一次测量都会沉积有害的电子剂量。该团队引入STEMGym,这是一个开源的Gymnasium基准测试,包含15个基于物理模拟的STEM环境,横跨五种材料、三个难度等级和四项表征任务,并通过剂量效率曲线面积(DEC-AUC)这一单一的标量指标来量化信息与剂量之间的帕累托前沿。在现实剂量预算下的33种代理配置中,剂量效率的决定性因素是分析(感知)流程,而非导航器:将经过训练的CNN分析师与简单的光栅扫描相结合,DEC-AUC相比于无CNN的光栅基线提升了5.5倍(0.287 对 0.052),而用贝叶斯或自适应有限状态机导航替代光栅扫描,并未带来统计上显著的进一步收益。生产级别的视觉-语言模型在晶体缺陷分析方面的表现比任务特定的CNN差约13倍。通过在统一的剂量预算下解耦感知、导航和规划,STEMGym重新界定了在自主电子显微镜中机器学习投入应聚焦的方向,并提供了验证该方向的测量基础设施。
作者单位: VIP可见
提交arXiv: 2026-06-28 20:23

量科快讯