健康 2022-07-04 06:39

Representative image

休斯顿(美国),7月3日:机器人和人类一样,看不到过去的障碍。为了到达目的地,它们偶尔需要一点帮助。根据一项新的研究,莱斯大学的工程师们发明了一种技术,使人们能够帮助机器人观察周围环境并进行工作。

这种名为“黑暗中的贝叶斯学习”(Bayesian Learning IN The Dark,简称BLIND)的策略,是一种新颖的解决方案,解决了机器人在并非所有东西都能一直清晰可见的环境中工作时的运动规划问题。

这项由计算机科学家Lydia Kavraki和Vaibhav Unhelkar以及莱斯大学乔治·r·布朗工程学院的共同主要作者Carlos Quintero-Pena和Constantinos Chamzas领导的同行评议研究在5月底的电气和电子工程师协会机器人和自动化国际会议上发表。

该算法主要是由Quintero-Pena和Chamzas开发的,他们都是与Kavraki一起工作的研究生,根据这项研究,该算法保持一个人在回路中,以“增强机器人的感知能力,重要的是,防止执行不安全的动作”。

为此,他们将贝叶斯逆强化学习(通过这种方法,系统可以从不断更新的信息和经验中学习)与已有的运动规划技术相结合,以帮助具有“高自由度”的机器人——即有很多运动部件。

为了测试BLIND,莱斯实验室设计了一个Fetch机器人,这是一个有7个关节的关节臂,可以从桌子上抓取一个小圆柱体并将其移动到另一个桌子上,但在这个过程中,它必须通过一个障碍物。

“如果你有更多的关节,对机器人的指令就会变得复杂,”金特罗-佩纳说。“如果你在指挥一个人,你只需要说,‘举起你的手。’”

但机器人的程序员必须对其轨迹中每一点的每个关节的运动都有具体的描述,尤其是当障碍物挡住机器对目标的“视野”时。

BLIND并没有预先规划轨迹,而是在中间插入了一个人工流程,以完善机器人算法提出的精心设计的选项——或最佳猜测。Quintero-Pena说:“BLIND可以让我们在人脑中获取信息,并在这个高度自由的空间中计算我们的轨迹。”

他说:“我们使用一种特殊的反馈方式,称为批评,基本上是一种二元形式的反馈,在这种反馈中,人类会被赋予轨迹碎片的标签。”

这些标签显示为连接的绿点,表示可能的路径。在BLIND从一个点走到另一个点的过程中,人类通过批准或拒绝每一个动作来完善路径,尽可能高效地避开障碍物。

查萨斯说:“这是一个易于使用的界面,因为我们可以说,‘我喜欢这个’或‘我不喜欢那个’,机器人利用这些信息进行规划。”他说,一旦得到一组被认可的动作的奖励,机器人就可以执行它的任务。

“这里最重要的一点是,人类的偏好很难用数学公式来描述,”金特罗-佩纳说。“我们的工作通过融入人类的偏好来简化人机关系。这就是我认为应用程序将从这项工作中获得最大收益的方式。”

机器人领域的先驱卡夫拉基说:“这项工作很好地证明了,在某些部分机器人完全不知道、但人类知道的环境中,人类少量但有针对性的干预可以显著提高机器人执行复杂任务的能力。”卡夫拉基的经历包括为美国宇航局(NASA)在国际空间站(International Space Station)的人形机器人Robonaut编写高级程序。

“它展示了我的同事Unhelkar教授研究的人机交互方法,以及我的实验室开创多年的自动化规划,如何融合在一起,提供可靠的解决方案,同时尊重人类的偏好。”


推荐阅读:迪拜房产