在物理和工程等领域,偏微分方程(PDEs)被用来模拟复杂的物理过程,以深入了解世界上一些最复杂的物理和自然系统是如何运作的。
为了解决这些困难的方程,研究人员使用高保真的数值求解器,这可能非常耗时且计算成本高。当前简化的替代方案,即数据驱动的代理模型,计算pde解决方案的目标属性,而不是整个解决方案。它们在高保真度求解器生成的一组数据上进行训练,以预测新输入的偏微分方程的输出。这是数据密集型且昂贵的,因为复杂的物理系统需要大量的模拟来生成足够的数据。
在12月发表在《自然机器智能》杂志上的一篇新论文中,“偏微分方程的物理增强深度替代模型”提出了一种新方法,用于为力学、光学、热输运、流体动力学、物理化学和气候模型等领域的复杂物理系统开发数据驱动的替代模型。
该论文由麻省理工学院应用数学教授Steven G. Johnson与麻省理工学院-IBM沃森人工智能实验室和IBM研究院的Payel Das和Youssef Mroueh共同撰写;Julia Lab的Chris Rackauckas;以及Raphaël pestourrie,他曾是麻省理工学院的博士后,现在在佐治亚理工学院工作。作者称他们的方法为“物理增强深度代理”(PEDS),它将低保真度、可解释的物理模拟器与神经网络生成器结合在一起。神经网络生成器端对端进行训练,以匹配高保真数值求解器的输出。
“我的愿望是用系统的、计算机辅助的模拟和优化来取代低效的试错过程,”佩斯托里说。“最近人工智能的突破,比如ChatGPT的大型语言模型,依赖于数千亿个参数,需要大量的资源来训练和评估。相比之下,PEDS对所有人来说都是负担得起的,因为它在计算资源方面非常高效,并且在使用它所需的基础设施方面障碍非常低。”
在这篇文章中,他们表明,PEDS替代品可以比具有有限数据(大约1000个训练点)的前馈神经网络的集合准确三倍,并且将所需的训练数据减少至少100倍,以达到5%的目标误差。使用麻省理工学院设计的Julia编程语言开发,这种科学的机器学习方法在计算和数据方面都很有效。
作者还报告说,PEDS提供了一种通用的、数据驱动的策略,以弥合大量简化物理模型与相应的强力数值解算器建模复杂系统之间的差距。这种技术提供了准确性、速度、数据效率和对流程的物理洞察。
佩斯托里说:“自2000年代以来,随着计算能力的提高,科学模型的趋势是增加参数的数量,以更好地拟合数据,有时以降低预测精度为代价。通过明智地选择参数,PEDS做了相反的事情。它利用自动微分技术来训练一个神经网络,使一个只有很少参数的模型变得准确。”
“阻止替代模型在工程中得到更广泛应用的主要挑战是维度的诅咒——训练模型所需的数据随着模型变量的数量呈指数增长,”pestourrie说。PEDS通过将数据信息和现场知识以低保真模型求解器的形式整合在一起,从而减少了这一问题。”
这组科学家说,PEDS有可能使2000年以前的全部文献恢复到最小模型——PEDS可以使直观的模型更加精确,同时也可以预测替代模型的应用。
“PEDS框架的应用超出了我们在这项研究中所展示的,”Das说。“由偏微分方程控制的复杂物理系统无处不在,从气候建模到地震建模等等。我们受物理启发的快速且可解释的替代模型将在这些应用中发挥重要作用,并对基础模型等其他新兴技术起到补充作用。”
这项研究得到了麻省理工学院- ibm沃森人工智能实验室和美国陆军研究办公室通过士兵纳米技术研究所的支持。
作者:桑迪·米勒:数学系
链接:https://news.mit.edu/2024/peds-technique-could-efficiently-solve-partial-differential-equations-0108
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com
2024-01-15 13:11:43
桑迪·米勒:数学系