想象一下,一个机器人正在帮你洗碗。你让它从水槽里拿起一个肥皂碗,但它的抓取器有点失手。
使用麻省理工学院和英伟达研究人员开发的新框架,你可以通过简单的交互来纠正机器人的行为。这种方法可以让你指向碗,或者在屏幕上追踪它的轨迹,或者只是向正确的方向轻轻推一下机器人的手臂。
与其他纠正机器人行为的方法不同,这种技术不需要用户收集新数据,也不需要重新训练机器人大脑的机器学习模型。它使机器人能够使用直观的、实时的人类反馈来选择一个可行的动作序列,尽可能接近满足用户的意图。
当研究人员测试他们的框架时,它的成功率比不利用人为干预的替代方法高21%。
从长远来看,这个框架可以使用户更容易地指导工厂训练的机器人执行各种各样的家务,即使机器人从未见过他们的家或家里的东西。
“我们不能指望外行来进行数据收集和微调神经网络模型。消费者希望机器人开箱即用,如果不是这样,他们会想要一个直观的机制来定制它。这就是我们在这项工作中解决的挑战,”Felix Yanwei Wang说,他是一名电子工程和计算机科学(EECS)研究生,也是一篇关于这种方法的论文的主要作者。
合著者有王丽蕊博士、杜一伦博士;资深作者Julie Shah,麻省理工学院航空航天教授,计算机科学与人工智能实验室(CSAIL)互动机器人小组主任;以及Balakumar Sundaralingam、杨旭宁、Chao Yu-Wei、Claudia Perez-D ' arpino博士和NVIDIA的Dieter Fox。这项研究将在国际机器人与自动化会议上发表。
减轻失调
最近,研究人员已经开始使用预训练的生成式人工智能模型来学习一个“策略”,或者一组规则,机器人遵循这些规则来完成一个动作。生成模型可以解决多个复杂的任务。
在训练过程中,模型只看到可行的机器人运动,因此它学习生成有效的轨迹供机器人跟随。
虽然这些轨迹是有效的,但这并不意味着它们总是与现实世界中的用户意图一致。机器人可能已经接受过从书架上抓取盒子而不撞倒它们的训练,但如果某人的书架的方向与训练中看到的不同,它可能无法到达书架顶部的盒子。
为了克服这些故障,工程师通常会收集数据来展示新任务并重新训练生成模型,这是一个昂贵且耗时的过程,需要机器学习专业知识。
相反,麻省理工学院的研究人员希望允许用户在机器人出错时控制它的行为。
但是,如果人类与机器人交互以纠正其行为,则可能会无意中导致生成模型选择无效的操作。它可能会到达用户想要的盒子,但在这个过程中会把书架上的书撞倒。
王说:“我们希望允许用户与机器人互动,而不会引入这些错误,所以我们在部署过程中得到的行为更符合用户的意图,但这也是有效和可行的。”
他们的框架通过向用户提供三种直观的方法来纠正机器人的行为来实现这一目标,每种方法都有一定的优势。
首先,用户可以在显示其相机视图的界面中指向他们希望机器人操作的对象。其次,他们可以在该界面中跟踪轨迹,允许他们指定他们希望机器人如何到达物体。第三,他们可以按照他们想要的方向移动机器人的手臂。
“当你将环境的2D图像映射到3D空间中的动作时,一些信息会丢失。在不丢失任何信息的情况下,用身体轻推机器人是明确用户意图的最直接方式。”
成功的抽样
为了确保这些相互作用不会导致机器人选择无效的动作,例如与其他物体碰撞,研究人员使用了特定的采样程序。该技术允许模型从最符合用户目标的有效操作集中选择一个操作。
王解释说:“我们不是把用户的意愿强加给机器人,而是让机器人知道用户的意图,但让采样过程围绕它自己的一组学习行为振荡。”
这种抽样方法使研究人员的框架优于他们在模拟和实验中与玩具厨房中的真实机械臂进行比较的其他方法。
虽然他们的方法可能并不总是立即完成任务,但它为用户提供了一个好处,即如果他们看到机器人做错了什么,他们可以立即纠正机器人,而不是等待它完成,然后给它新的指令。
此外,在用户轻推机器人几次,直到它拿起正确的碗后,它可以记录这个纠正动作,并通过未来的训练将其纳入自己的行为中。然后,第二天,机器人可以在不需要轻推的情况下拿起正确的碗。
“但持续改进的关键是有一种方法让用户与机器人互动,这就是我们在这里展示的,”王说。
在未来,研究人员希望在保持或改善其性能的同时提高采样过程的速度。他们还想在新环境中试验机器人的政策生成。
作者:密歇根医学-密歇根大学
链接:https://news.mit.edu/2025/ai-system-fragfold-predicts-protein-fragments-0220
著作权归作者所有。
声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:152 6451 3609,邮箱:1027830374@qq.com
2025-03-18 08:17:15
Adam Zewe麻省理工学院新闻