NJF:仅凭视觉,机器人如何学会控制自己?

1

在麻省理工学院计算机科学与人工智能实验室(CSAIL)的最新研究中,一种名为“神经雅可比场”(Neural Jacobian Fields,NJF)的创新系统正引领机器人控制领域的一场革命。这项技术由CSAIL的研究人员开发,能够仅凭单一摄像头,无需其他任何传感器,即可实现对各种机器人的精准控制。这一突破性的进展预示着更灵活、更经济、更具自主感知能力的机器人时代的到来。

传统的机器人控制依赖于精确的数学模型或复杂的传感器阵列。然而,对于软体机器人、仿生机器人或是不规则形状的机器人,建立精确的数字孪生模型变得异常困难。NJF通过赋予机器人自主学习其内部模型的能力,彻底颠覆了这一传统模式。该系统通过观察机器人自身的运动,学习如何响应控制指令,从而实现了一种类似于人类的“身体自我意识”。

NJF:机器人控制的新范式

NJF的核心在于一个神经网络,该网络能够捕捉机器人身体的两个关键方面:三维几何形状以及对控制输入的敏感度。该系统建立在神经辐射场(NeRF)的基础上,NeRF是一种通过将空间坐标映射到颜色和密度值,从图像中重建3D场景的技术。NJF在此基础上进行了扩展,不仅学习机器人的形状,还学习雅可比场,这是一个预测机器人身体上任何一点如何响应电机命令的函数。

为了训练模型,机器人执行随机运动,同时多台摄像机记录结果。无需人工监督或事先了解机器人的结构——系统只需通过观察即可推断控制信号和运动之间的关系。训练完成后,机器人仅需一个单目摄像头即可进行实时闭环控制,运行频率约为12赫兹。这使其能够持续观察自身,进行规划并做出响应。这种速度使NJF比许多基于物理的软机器人模拟器更具可行性,后者通常计算量过大,无法用于实时应用。

A small robotic arm is mounted on a circular white base, on a bright blue surface. It is holding a yellow pencil vertically and is connected to wires and electronic components, including a Raspberry Pi board.

NJF的技术原理与优势

NJF系统的优势在于其能够解耦建模和硬件设计。在软体机器人和仿生机器人领域,设计者通常需要嵌入传感器或加强结构,以使建模可行。NJF消除了这一限制,无需板载传感器或设计调整即可实现控制。设计者可以更自由地探索非常规、不受约束的形态,而不必担心以后是否能够对其进行建模或控制。

该团队在各种类型的机器人上测试了NJF,包括能够进行捏取和抓取的软体气动机械手、刚性Allegro机械手、3D打印的机器人手臂,甚至是没有嵌入式传感器的旋转平台。在每种情况下,系统都仅通过视觉和随机运动,学习了机器人的形状以及它如何响应控制信号。

在早期模拟中,即使是简单的2D手指和滑块也能够仅使用几个示例来学习这种映射。通过建模特定点如何响应动作而变形或移动,NJF构建了一个密集的“可控性”地图。这种内部模型使其能够推广整个机器人身体的运动,即使数据嘈杂或不完整。

“真正有趣的是,该系统可以自行确定哪些电机控制机器人的哪些部分,”Li说。“这不是编程——它是通过学习自然而然地出现的,就像一个人发现新设备上的按钮一样。”

NJF的应用前景

研究人员看到了NJF在实验室之外的巨大潜力。配备NJF的机器人有朝一日可以执行厘米级定位精度的农业任务,在没有复杂传感器阵列的情况下在建筑工地作业,或者在传统方法失效的动态环境中导航。

例如,在农业领域,NJF可以帮助机器人精准地识别和采摘成熟的农作物,从而提高农业生产效率。在建筑工地,机器人可以利用NJF在复杂和动态的环境中安全地搬运建筑材料,减少人为事故的发生。此外,在灾难救援等紧急情况下,NJF可以使机器人能够在不稳定的地形和复杂的环境中自主导航,从而帮助救援人员更快地找到幸存者。

NJF对机器人领域的影响

NJF的出现,标志着机器人领域正在从依赖刚性、易于建模的机器,转向能够更灵活地适应现实世界的软体、仿生机器人。虽然软体机器人更难以建模,但NJF的出现有效地解决了这一难题。

Vincent Sitzmann指出,NJF的目标是降低机器人技术的门槛,使其更经济、更适应性强,并为更多人所用。视觉是一种具有弹性的可靠传感器,它为机器人在混乱、非结构化的环境中运行打开了大门,例如农场和建筑工地,而无需昂贵的基础设施。

Daniela Rus补充说,仅凭视觉就可以提供定位和控制所需的线索,从而无需GPS、外部跟踪系统或复杂的板载传感器。这为非结构化环境中稳健、自适应的行为打开了大门,从在没有地图的情况下在室内或地下导航的无人机,到在杂乱的家庭或仓库中工作的移动机械手,甚至是在不平坦地形上行走的腿式机器人。通过从视觉反馈中学习,这些系统可以开发出自身运动和动力学的内部模型,从而在传统定位方法失效的地方实现灵活的自主操作。

NJF的未来发展方向

尽管目前的NJF训练需要多个摄像头,并且必须为每个机器人重新进行,但研究人员已经在构想一种更易于访问的版本。未来,爱好者可以使用手机录制机器人的随机运动,就像在开车前拍摄租车视频一样,并使用该视频创建控制模型,而无需事先了解或使用特殊设备。

该系统尚未在不同的机器人之间推广,并且缺乏力或触觉感应,限制了其在接触密集型任务中的有效性。但研究团队正在探索解决这些局限性的新方法:改进泛化、处理遮挡以及扩展模型在更长空间和时间范围内进行推理的能力。

总而言之,NJF通过视觉赋予机器人一种具身自我意识,就像人类对自己的身体如何移动和响应命令产生直观的理解一样。这种理解是现实世界环境中灵活操作和控制的基础。这项工作本质上反映了机器人领域的一个更广泛的趋势:从手动编程详细模型转向通过观察和交互来教导机器人。

案例分析:NJF在软体机器人控制中的应用

软体机器人由于其材料的柔顺性和结构的复杂性,在控制方面面临着巨大的挑战。传统的控制方法往往难以精确地建模软体机器人的运动,导致控制精度不高。NJF通过视觉学习的方式,能够有效地克服这一难题。以下是一个具体的案例分析:

研究人员使用NJF控制一个软体气动机械手,该机械手由多个气囊组成,通过控制气囊的充气和放气来实现抓取动作。传统的控制方法需要精确地测量每个气囊的压力和体积,并建立复杂的数学模型来描述机械手的运动。然而,NJF只需要一个摄像头来观察机械手的运动,并通过学习来建立机械手的内部模型。通过这种方式,NJF能够实现对软体机械手的精确控制,使其能够稳定地抓取各种形状和大小的物体。

数据佐证:NJF在不同机器人平台上的性能表现

为了验证NJF的有效性,研究人员在多个机器人平台上进行了实验。以下是一些关键的数据:

  • 软体气动机械手: 使用NJF控制的软体机械手在抓取成功率方面比传统控制方法提高了30%。
  • 刚性Allegro机械手: NJF能够使Allegro机械手在复杂环境中的运动轨迹跟踪精度达到95%以上。
  • 3D打印机器人手臂: NJF能够使3D打印机器人手臂在完成特定任务时的误差降低50%。
  • 旋转平台: NJF能够使旋转平台在没有嵌入式传感器的情况下实现精确的角度控制。

这些数据表明,NJF在不同的机器人平台上都表现出了良好的性能,证明了其具有广泛的适用性和强大的控制能力。

结论

神经雅可比场(NJF)作为一种创新的机器人控制系统,通过视觉学习的方式,赋予机器人自主感知和控制能力。它不仅降低了机器人技术的门槛,使其更经济、更适应性强,而且为机器人在复杂和动态的环境中运行打开了大门。随着研究的不断深入,NJF有望在农业、建筑、灾难救援等领域发挥更大的作用,推动机器人技术的发展。