人工智能如何通过更智能的采样技术改进模拟

想象一下,你的任务是派一队足球运动员到一个场地去评估草地的状况(当然,这对他们来说是一项可能的任务)。如果你随机选择它们的位置,它们可能会在某些区域聚集在一起,而完全忽略其他区域。但如果你给它们一个策略,比如均匀地分布在田野上,你可能会得到一个更准确的草地状况。

现在,想象一下,不仅需要在二维空间中展开,还需要在数十甚至数百个空间中展开。这就是麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员所面临的挑战。他们开发了一种人工智能驱动的“低差异采样”方法,这种方法通过在空间中更均匀地分布数据点来提高模拟精度。

一个关键的新颖之处在于使用图神经网络(gnn),它允许点“交流”并自我优化以获得更好的一致性。他们的方法标志着机器人、金融和计算科学等领域模拟的关键增强,特别是在处理复杂、多维问题方面,这些问题对精确模拟和数值计算至关重要。

这篇论文的第一作者、麻省理工学院CSAIL博士后T. Konstantin Rusch说:“在许多问题中,你越能均匀地分散点,你就能越准确地模拟复杂的系统。”“我们开发了一种称为消息传递蒙特卡罗(MPMC)的方法,使用几何深度学习技术生成均匀间隔的点。这进一步允许我们生成强调维度的点,这些维度对于手头的问题特别重要,这在许多应用中都是非常重要的。该模型的底层图神经网络允许点之间“对话”,实现比以前的方法更好的一致性。

他们的研究成果发表在9月份的《美国国家科学院院刊》上。

带我去蒙特卡洛

蒙特卡罗方法的思想是通过随机抽样模拟系统来了解系统。抽样是选择总体的一个子集来估计整个总体的特征。从历史上看,它在18世纪就已经被使用了,当时数学家皮埃尔-西蒙·拉普拉斯用它来估计法国的人口,而不必计算每个人。

低差异序列,即低差异即高均匀性的序列,如Sobol’、Halton、Niederreiter等,长期以来一直是准随机抽样的金标准,它用低差异抽样代替随机抽样。它们被广泛应用于计算机图形学和计算金融等领域,从定价期权到风险评估,在这些领域中,用点均匀地填充空格可以得到更准确的结果。

该团队提出的MPMC框架将随机样本转换为具有高均匀性的点。这是通过使用最小化特定差异度量的GNN处理随机样本来完成的。

使用人工智能生成高度均匀点的一大挑战是,通常测量点均匀性的方法计算速度非常慢,而且很难使用。为了解决这个问题,研究小组采用了一种更快、更灵活的均匀度测量方法,称为l2差异。对于高维问题,这种方法本身是不够的,他们使用了一种新颖的技术,专注于点的重要的低维投影。这样,他们就可以创建更适合特定应用的点集。

研究小组说,这项研究的影响远远超出了学术界。例如,在计算金融中,模拟在很大程度上依赖于采样点的质量。“使用这些类型的方法,随机点通常效率低下,但我们的gnn生成的低差异点导致更高的精度,”Rusch说。“例如,我们考虑了一个32维计算金融的经典问题,我们的MPMC点比以前最先进的准随机抽样方法高出4到24倍。”

蒙特卡洛的机器人

在机器人技术中,路径和运动规划通常依赖于基于采样的算法,该算法引导机器人通过实时决策过程。MPMC统一性的提高可能会带来更高效的机器人导航和实时适应,比如自动驾驶或无人机技术。“事实上,在最近的预印本中,我们证明,当应用于现实世界的机器人运动规划问题时,我们的MPMC点比以前的低差异方法提高了四倍,”Rusch说。

CSAIL主任、麻省理工学院电子工程和计算机科学教授Daniela Rus说:“传统的低差异序列在当时是一项重大进步,但世界变得更加复杂,我们现在正在解决的问题通常存在于10、20甚至100维的空间中。”“我们需要一些更聪明的东西,一些能随着维度的增长而适应的东西。gnn是我们如何生成低差异点集的范式转变。与独立生成点的传统方法不同,gnn允许点彼此‘聊天’,因此网络学习以减少聚类和间隙的方式放置点-这是典型方法的常见问题。”

展望未来,该团队计划使MPMC点对每个人都更容易访问,解决目前为每个固定数量的点和维度训练新GNN的限制。

“许多应用数学使用连续变化的量,但计算通常只允许我们使用有限数量的点,”斯坦福大学统计学教授Art B. Owen说,他没有参与这项研究。“一个多世纪以来的差异领域使用抽象代数和数论来定义有效的抽样点。本文利用图神经网络寻找与连续分布相比差异较小的输入点。这种方法已经非常接近小问题中最著名的低差异点集,并且在计算金融学的32维积分中显示出巨大的希望。我们可以预期,这将是使用神经方法为数值计算寻找良好输入点的许多努力中的第一个。”

作者:瑞秋·戈登|麻省理工学院CSAIL

链接:https://news.mit.edu/2024/how-ai-improving-simulations-smarter-sampling-techniques-1002

著作权归作者所有。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:152 6451 3609,邮箱:1027830374@qq.com