⏶7
AutoMat:通过 Agent 工具使用实现基于显微镜数据的自动化晶体结构重建
发表
由
Ivan Tang 提交
作者:
Yaotian Yang,
Yiwen Tang, Yizhe Chen, Xiao Chen, Jiangjie Qiu, Hao Xiong, Haoyu Yin, Zhiyao Luo, Yifei Zhang, Sijia Tao, Wentao Li, Qinghua Zhang, Yuqiang Li, Wanli Ouyang, Bin Zhao, Xiaonan Wang, Fei Wei
摘要
基于机器学习的原子间势和力场在很大程度上依赖于精确的原子结构,但由于实验解析晶体的可用性有限,这类数据非常稀缺。尽管原子分辨率电子显微镜提供了一种潜在的结构数据来源,但将这些图像转换为模拟就绪格式仍然劳动密集且容易出错,这为模型训练和验证造成了瓶颈。我们引入了 AutoMat,这是一个端到端、由代理辅助的流水线,可自动将扫描透射电子显微镜 (STEM) 图像转换为原子晶体结构并预测其物理性质。AutoMat 结合了模式自适应去噪、物理引导的模板检索、对称感知的原子重建、通过 MatterSim 进行快速弛豫和性质预测,以及跨所有阶段的协调编排。我们为这项任务提出了第一个专用的 STEM2Mat-Bench,并使用晶格 RMSD、形成能 MAE 和结构匹配成功率来评估性能。通过编排外部工具调用,AutoMat 使纯文本 LLM 在该领域胜过视觉-语言模型,并在整个流水线中实现了闭环推理。在超过 450 个结构样本的大规模实验中,AutoMat 显著优于现有的多模态大型语言模型和工具。这些结果验证了 AutoMat 和 STEM2Mat-Bench,标志着在材料科学中连接显微术和原子模拟的关键一步。代码和数据集可在 https://github.com/yyt-2378/AutoMat 和 https://huggingface.co/datasets/yaotianvector/STEM2Mat 公开获取。
代码和数据集已公开,可在 https://github.com/yyt-2378/AutoMat 和 https://huggingface.co/datasets/yaotianvector/STEM2Mat 获取。