MatterGen:基于生成式AI的材料设计新范式
发布日期:2025-01-21 20:25:51
浏览次数: 1533
来源:微软亚洲研究院
推荐语
微软推出创新的生成式 AI 材料设计工具 MatterGen,突破传统局限,影响深远。这是小贤看到的关于材料设计最好的建议,没有之一。
核心内容:
1. 传统材料设计的局限
2. MatterGen 的创新之处
3. 对相关领域的影响
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
编者按:近日,微软研究院科学智能中心提出了一种创新的生成式 AI 材料设计工具 MatterGen, 突破了传统材料筛选方法的局限,能够在更广泛的材料空间中进行高效探索,并根据应用需求直接生成新材料。该模型可以针对材料的特殊几何结构进行优化,在化学成分、物理属性等多方面生成稳定的新型材料,开启了基于生成式 AI 辅助材料设计的新范式,并将对电池、磁铁等领域的创新产生深远影响。材料创新是推动重大技术突破的关键因素之一。20世纪80年代锂钴氧化物的发现为现在的锂离子电池技术奠定了基础。如今,锂离子电池为现代手机和电动汽车提供动力,影响着数十亿人的日常生活。材料创新同样是设计更高效太阳能电池、用于电网级能源存储的低成本电池,以及用于从大气中回收二氧化碳吸附剂所必需的一环。找到一种符合特定需求的新材料如同大海捞针。过去,这项任务需要通过昂贵且耗时的实验试错来完成。近年来,计算筛选大规模材料数据库加快了这一过程,但仍需要筛选数百万个候选材料才能找到少数合适的。在顶级科学杂志《自然》(《Nature》)近期发表的论文中,微软研究院科学智能中心的研究员们提出了一个从不同角度解决材料发现问题的生成式 AI 工具 MatterGen。不同于筛选候选材料,MatterGen 直接根据应用需求的设计要求生成新的材料,可以生成具有所需化学、机械、电子或磁性属性,以及满足不同约束条件的材料。MatterGen 开启了一种基于生成式 AI 辅助材料设计的新范式,能够高效探索材料,进而超越已知的材料范围。论文链接:
https://www.nature.com/articles/s41586-025-08628-5
GitHub 链接:
https://github.com/microsoft/mattergen
作为一个基于材料三维几何结构的扩散模型,MatterGen 可以通过调整随机结构中的元素、位置和周期性晶格来生成所需的材料结构,这类似于图像扩散模型根据文本提示修改噪声图像像素颜色来生成图片。该扩散架构专为材料设计,旨在解决周期性和三维几何等特殊性质问题。MatterGen 的基础模型在生成新颖、稳定且多样化的材料方面已达到领先水平(如图2所示)。该模型利用来自 Materials Project(MP)和 Alexandria(Alex)数据库的608,000种稳定材料进行训练。其性能的提升得益于架构的优化以及高质量、大规模的训练数据。图2:MatterGen 与其他方法在生成稳定、新颖和独特结构的材料方面的性能比较。每种方法的训练数据集在括号中标出。紫色表示仅由于 MatterGen 架构带来的性能提升,青色则表示由更大的数据集带来的性能提升。Materials Project
https://next-gen.materialsproject.org/
Alexandria 数据库
https://alexandria.icams.rub.de/
MatterGen 还可以通过标注数据集进行微调,在给定任何所需条件的情况下生成新材料。图3展示了在给定目标的化学成分和对称性约束,以及电子、磁性和机械属性限制的情况下,生成新材料的示例。图3:MatterGen 示意图。MatterGen 可以根据不同设计要求,如特定的化学成分、晶体对称性或材料属性,对模型进行微调。
MatterGen 相对于筛选方法的主要优势在于其能够访问未知材料的完整空间。如图4所示,MatterGen 在生成难以被压缩的具有较高体积模量(如大于400 GPa)的新候选材料方面表现优异。相比之下,筛选基准方法受限于已知材料而趋于饱和。图4:MatterGen(青色)与传统筛选方法(黄色)在寻找满足设计要求(如具有大于400 GPa的体积模量)的新颖、稳定和独特结构方面的性能对比。
成分无序是一个常见现象,指的是不同的原子可以在合成材料中随机交换它们的晶体学位置。近年来,社区持续探索在计算设计材料的背景下,什么才算是新颖的材料,因为广泛使用的算法无法区分相似元素仅在排列上有所不同的两种结构。图5:成分无序示意图。左:没有成分无序的完美晶体,具有重复的单位晶胞(黑色虚线)。右:具有成分无序的晶体,其中每个位置有50%的概率为黄色和青色原子。通过引入一种考虑了成分无序的新的结构匹配算法,研究员们为该问题提供了初步的解决方案。该算法能够评估两个结构是否可以被识别为有序的近似同一基础成分无序结构,为材料的新颖性和独特性提供了新的定义。目前该方法已在计算评估指标中采用,并作为评估工具的一部分公开发布。
GitHub 链接:
https://github.com/microsoft/mattergen?tab=readme-ov-file#evaluation
除了大量的计算评估,MatterGen 的能力还通过实验合成得到了验证。微软研究院科学智能中心与中国科学院深圳先进技术研究院合作合成了一种新材料 TaCr2O6,其结构是通过 MatterGen 在给定200 GPa的体积模量条件下生成的。合成材料的结构与 MatterGen 提出的结构一致,但在 Ta 和 Cr 之间存在成分无序。此外,通过实验测得该材料的体积模量为169 GPa,相比设计规格中的200 GPa,误差低于20%,从实验角度看非常接近。如果类似的结果能够推广到其他领域,MatterGen 将对电池、燃料电池等材料的设计产生深远影响。
MatterGen 为 AI 加速材料设计提供了新的机会,同时与微软研究院科学智能中心此前提出的 AI 模拟器 MatterSim 相得益彰。MatterSim 遵循科学发现的第五范式,显著加速了材料属性模拟的速度。而 MatterGen 则在属性生成的基础上加速了新材料候选的探索。两者协同作用既可以加速材料模拟,又能够加速新材料的探索,从而形成飞轮效应。为了最大程度地推动材料设计的影响力,研究员们现已将 MatterGen 的源代码以 MIT 许可的方式发布,并公开了训练和微调数据,供社区使用和进一步开发。
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业