人工智能模型可以揭示晶体材料的结构

100多年来,科学家们一直在使用x射线晶体学来确定金属、岩石和陶瓷等晶体材料的结构。

这种技术在晶体完整的情况下效果最好,但在许多情况下,科学家们只有一个粉末版本的材料,其中包含随机的晶体碎片。这使得拼凑整体结构更具挑战性。

麻省理工学院的化学家们现在提出了一种新的生成式人工智能模型,可以更容易地确定这些粉末晶体的结构。该预测模型可以帮助研究人员表征用于电池、磁铁和许多其他应用的材料。

“对于任何材料,结构都是你需要知道的第一件事。这对超导性很重要,对磁体很重要,对知道你创造了什么光伏很重要。这对任何你能想到的以材料为中心的应用都很重要,”麻省理工学院弗雷德里克·乔治·凯斯化学教授丹娜·弗里德曼说。

Freedman和斯坦福大学计算机科学教授Jure Leskovec是这项新研究的资深作者,该研究今天发表在《美国化学学会杂志》上。麻省理工学院的研究生Eric Riesel和耶鲁大学的本科生Tsach Mackey是这篇论文的主要作者。

晶体材料,包括金属和大多数其他无机固体材料,是由许多相同的重复单元组成的晶格构成的。这些单位可以被认为是具有独特形状和大小的“盒子”,原子精确地排列在其中。

当x射线照射到这些晶格上时,它们会以不同的角度和强度衍射原子,从而揭示出原子的位置和它们之间的键的信息。自20世纪初以来,这项技术已被用于分析材料,包括具有晶体结构的生物分子,如DNA和一些蛋白质。

对于仅以粉末状晶体形式存在的材料,解决这些结构变得更加困难,因为碎片不携带原始晶体的完整3D结构。

“精确的晶格仍然存在,因为我们所说的粉末实际上是微晶体的集合。所以,你有相同的晶格作为一个大晶体,但他们是在一个完全随机的方向,”弗里德曼说。

对于数千种这样的材料,x射线衍射模式存在,但仍未解决。为了试图破解这些材料的结构,弗里德曼和她的同事们根据一个名为“材料项目”的数据库中的数据训练了一个机器学习模型,该数据库包含超过15万种材料。首先,他们将成千上万的这种材料放入一个现有的模型中,这个模型可以模拟x射线衍射模式的样子。然后,他们用这些模式来训练他们的人工智能模型,他们称之为Crystalyze,来预测基于x射线模式的结构。

该模型将预测结构的过程分解为几个子任务。首先,它决定晶格“盒子”的大小和形状,以及哪些原子将进入其中。然后,它预测盒子里原子的排列。对于每个衍射图案,模型生成几个可能的结构,可以通过将这些结构输入到确定给定结构的衍射图案的模型中来进行测试。

Riesel说:“我们的模型是生成式人工智能,这意味着它会生成以前从未见过的东西,这让我们能够产生几种不同的猜测。”“我们可以做一百次猜测,然后我们可以预测我们猜测的粉末图案应该是什么样子。如果输入看起来和输出完全一样,那么我们就知道我们做对了。”

研究人员在材料项目的几千个模拟衍射图案上测试了这个模型。他们还对来自RRUFF数据库的100多种实验衍射模式进行了测试,该数据库包含近14,000种天然晶体矿物的粉末x射线衍射数据,这些数据是他们在训练数据之外保留的。根据这些数据,该模型的准确率约为67%。然后,他们开始在衍射模式上测试这个模型,这是以前没有解决过的。这些数据来自粉末衍射文件,其中包含超过400,000个已解决和未解决的材料的衍射数据。

利用他们的模型,研究人员想出了100多个以前未解决的模式的结构。他们还利用他们的模型发现了三种材料的结构,这三种材料是弗里德曼的实验室通过强迫在大气压下不反应的元素在高压下形成化合物而创造的。这种方法可以用来生成晶体结构和物理性质完全不同的新材料,即使它们的化学成分是相同的。

石墨和金刚石——都是由纯碳制成的——就是这种材料的例子。弗里德曼开发的材料,每一种都含有铋和另一种元素,可以用于设计永磁体的新材料。

弗里德曼说:“我们从现有的数据中发现了很多新材料,最重要的是,我们从实验室中解决了三个未知的结构,这些结构构成了这些元素组合的第一个新的二元相。”

根据麻省理工学院团队的说法,能够确定粉末晶体材料的结构可以帮助研究人员在几乎任何与材料相关的领域工作,他们已经在crystalyze.org上发布了一个模型的网络界面。

作者:Anne Trafton | MIT新闻

链接:https://news.mit.edu/2024/ai-model-can-reveal-crystalline-materials-structures-0919

著作权归作者所有。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:152 6451 3609,邮箱:1027830374@qq.com