如何让机器人更聪明?给它编程序,让它知道它不知道的东西

现代机器人知道如何感知环境并对语言做出反应,但它们不知道的往往比它们知道的更重要。教会机器人寻求帮助是让它们更安全、更高效的关键。

普林斯顿大学(Princeton University)和谷歌(Google)的工程师们想出了一种新方法,让机器人知道自己什么时候不知道。这项技术包括量化人类语言的模糊性,并利用这一测量来告诉机器人何时该问路。告诉机器人从只有一个碗的桌子上捡起一个碗是相当清楚的。但是,当桌子上有五个碗时,让机器人拿起一个碗会产生更高程度的不确定性,并触发机器人要求澄清。

由于任务通常比简单的“拿起碗”命令更复杂,工程师们使用大型语言模型(llm)——ChatGPT等工具背后的技术——来衡量复杂环境中的不确定性。普林斯顿大学(Princeton)机械与航空航天工程助理教授阿尼鲁达·马朱达尔(Anirudha Majumdar)说,LLM给机器人带来了跟随人类语言的强大能力,但LLM的输出往往仍然不可靠。马朱达尔是一项研究的资深作者,概述了这种新方法。

马宗达说:“盲目地遵循法学硕士生成的计划可能会导致机器人以不安全或不可信的方式行动,因此我们需要基于法学硕士的机器人知道它们什么时候不知道。”

该系统还允许机器人的用户设定目标成功程度,这与一个特定的不确定性阈值相关联,该阈值将导致机器人寻求帮助。例如,用户可以将外科手术机器人设置为比清理客厅的机器人容错性低得多的机器人。

“我们希望机器人能够请求足够的帮助,这样我们就能达到用户想要的成功程度。但与此同时,我们希望将机器人需要的帮助总量降到最低,”普林斯顿大学机械与航空航天工程研究生、该研究的主要作者艾伦·任(Allen Ren)说。11月8日,任在亚特兰大举行的机器人学习会议上的演讲获得了最佳学生论文奖。与其他解决这一问题的方法相比,新方法产生了高精度,同时减少了机器人所需的帮助量。

研究人员在位于纽约市和加州山景城的谷歌工厂的模拟机械臂和两种类型的机器人上测试了他们的方法,任在山景城作为学生研究实习生工作。一组硬件实验使用桌面机械臂,任务是将一组玩具食品分成两个不同的类别;左臂和右臂的设置增加了一层额外的模糊性。

最复杂的实验包括将机械臂安装在一个轮式平台上,并与微波炉和一组可回收、堆肥和垃圾箱一起放置在办公室的厨房里。在一个例子中,一个人要求机器人“把碗放在微波炉里”,但是柜台上有两个碗——一个金属碗和一个塑料碗。

机器人基于llm的规划程序根据指令生成四种可能的动作,比如选择题,每个选项都有一个概率。研究人员使用一种称为适形预测的统计方法和用户指定的保证成功率,设计了他们的算法,当选项达到一定的概率阈值时,触发人类帮助的请求。在这种情况下,前两个选项——将塑料碗放入微波炉或将金属碗放入微波炉——满足这个阈值,机器人会询问人类将哪个碗放入微波炉。

在另一个例子中,一个人告诉机器人:“这里有一个苹果和一块脏海绵……它已经腐烂了。”你能处理掉它吗?”这不会触发机器人的问题,因为“把苹果放进堆肥里”的动作比任何其他选择都有更高的正确概率。

该研究的资深作者、普林斯顿大学(Princeton)机械与航空航天工程助理教授阿尼鲁达·马琼达(Anirudha Majumdar)说,“使用共形预测技术,以比以前的方法更严格的方式量化语言模型的不确定性,使我们能够达到更高的成功水平”,同时最大限度地减少触发帮助的频率。

机器人的物理限制通常会给设计师带来从抽象系统中难以获得的见解。大型语言模型“可能会在对话中跳出来,但它们无法跳过重力,”合著者、谷歌DeepMind的研究科学家安迪·曾(Andy Zeng)说。“我总是很想先看看我们能在机器人上做些什么,因为它往往能揭示制造普遍智能机器背后的核心挑战。”

据Majumdar介绍,在曾轶可在普林斯顿机器人系列研讨会上发表演讲后,任和Majumdar开始与曾轶可合作。曾轶可于2019年在普林斯顿大学获得计算机科学博士学位,他概述了谷歌在使用法学硕士研究机器人方面的努力,并提出了一些公开的挑战。Ren对如何校准机器人应该请求的帮助水平这一问题的热情,使他获得了实习机会,并创造了这种新方法。

Majumdar说:“我们很高兴能够利用谷歌的规模”,可以访问大型语言模型和不同的硬件平台。

Ren现在正在将这项工作扩展到机器人的主动感知问题:例如,当机器人本身在房子的不同部分时,机器人可能需要使用预测来确定电视,桌子或椅子在房子里的位置。Ren说,这需要一个基于结合视觉和语言信息的模型的计划器,这在估计不确定性和决定何时触发帮助方面提出了一系列新的挑战。


作者:普林斯顿大学工程学院

链接:https://www.sciencedaily.com/releases/2023/11/231128172842.htm

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com