当水结冰时,它从液相转变为固相,导致密度和体积等特性发生巨大变化。水中的相变是如此普遍,我们大多数人可能甚至没有想到它们,但新材料或复杂物理系统中的相变是一个重要的研究领域。
为了充分了解这些系统,科学家必须能够识别阶段并检测其间的过渡。但是,如何量化一个未知系统的相变往往是不清楚的,尤其是在数据稀缺的情况下。
麻省理工学院和瑞士巴塞尔大学的研究人员将生成式人工智能模型应用于这个问题,开发了一种新的机器学习框架,可以自动绘制新的物理系统的阶段图。
他们基于物理的机器学习方法比依赖理论专业知识的人工技术更有效。重要的是,由于他们的方法利用了生成模型,因此不需要其他机器学习技术中使用的庞大的标记训练数据集。
例如,这样的框架可以帮助科学家研究新材料的热力学性质,或者探测量子系统中的纠缠。最终,这项技术可以使科学家自主发现物质的未知阶段成为可能。
“如果你有一个具有完全未知属性的新系统,你将如何选择研究哪个可观测量?”我们希望,至少对于数据驱动的工具,您可以以自动化的方式扫描大型新系统,并且它将为您指出系统中的重要更改。这可能是自动科学发现新的、奇特的相特性的工具,”弗兰克Schäfer说,他是计算机科学和人工智能实验室(CSAIL)朱莉娅实验室的博士后,也是一篇关于这种方法的论文的合著者。
论文的第一作者、巴塞尔大学的研究生朱利安·阿诺德(Julian Arnold)加入了Schäfer;数学系应用数学教授、茱莉亚实验室负责人艾伦·埃德尔曼;以及巴塞尔大学物理系教授、资深作者Christoph Bruder。这项研究发表在今天的《物理评论快报》上。
使用AI检测相变
虽然水转变为冰可能是相变最明显的例子之一,但更奇特的相变,比如材料从正常导体转变为超导体,引起了科学家们的浓厚兴趣。
这些转换可以通过识别“顺序参数”来检测,“顺序参数”是一个重要的、预计会发生变化的数量。例如,当水的温度降到0摄氏度以下时,水会冻结并转变为固态(冰)。在这种情况下,一个适当的有序参数可以根据作为晶格一部分的水分子与保持无序状态的水分子的比例来定义。
过去,研究人员依靠物理专业知识手动构建相图,利用理论知识来了解哪些顺序参数是重要的。这不仅对于复杂的系统来说是乏味的,对于具有新行为的未知系统来说可能是不可能的,而且还会将人类的偏见引入解决方案中。
最近,研究人员已经开始使用机器学习来构建判别分类器,通过学习将测量统计数据分类为来自物理系统的特定阶段来解决这个任务,就像这些模型将图像分类为猫或狗一样。
麻省理工学院的研究人员展示了如何使用生成模型更有效地解决这一分类任务,并且以一种物理知情的方式。
Julia编程语言是一种流行的科学计算语言,也用于麻省理工学院的入门线性代数课程,它提供了许多工具,使其成为构建这种生成模型的无价工具,Schäfer补充道。
像ChatGPT和Dall-E这样的生成模型,通常通过估计一些数据的概率分布来工作,它们使用这些数据来生成适合分布的新数据点(例如与现有猫图像相似的新猫图像)。
然而,当使用可靠的科学技术对物理系统进行模拟时,研究人员可以免费获得其概率分布的模型。该分布描述了物理系统的测量统计量。
一个更有知识的模型
麻省理工学院团队的见解是,这个概率分布也定义了一个生成模型,在这个模型上可以构建分类器。他们将生成模型插入标准统计公式中,直接构建分类器,而不是像判别方法那样从样本中学习。
“这是一种很好的方式,可以将你对物理系统的了解深入到机器学习方案中。它不仅仅是对数据样本进行特征工程或简单的归纳偏差,”Schäfer说。
这个生成分类器可以在给定一些参数(如温度或压力)的情况下确定系统处于哪个阶段。由于研究人员直接从物理系统中近似测量的概率分布,分类器具有系统知识。
这使得他们的方法比其他机器学习技术表现得更好。因为它可以自动工作而不需要大量的训练,他们的方法显着提高了识别相变的计算效率。
最后,就像让ChatGPT解决数学问题一样,研究人员可以问生成分类器这样的问题:“这个样本属于阶段1还是阶段2 ?”或“该样品是在高温下生成的还是在低温下生成的?”
科学家们还可以使用这种方法来解决物理系统中不同的二元分类任务,可能是检测量子系统中的纠缠(状态是否纠缠?),或者确定理论A还是理论B最适合解决特定问题。他们还可以使用这种方法来更好地理解和改进像ChatGPT这样的大型语言模型,方法是确定应该如何调整某些参数,以便聊天机器人提供最佳输出。
在未来,研究人员还想研究理论上的保证,即他们需要多少测量才能有效地检测到相变,并估计所需的计算量。
这项工作部分由瑞士国家科学基金会、麻省理工学院-瑞士洛克希德马丁种子基金和麻省理工学院国际科学与技术倡议资助。
作者:Adam Zewe | MIT新闻
链接:https://news.mit.edu/2024/scientists-use-generative-ai-complex-questions-physics-0516
著作权归作者所有。
声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:152 6451 3609,邮箱:1027830374@qq.com
2024-05-17 08:25:21
Adam Zewe | MIT新闻