当一位花费数十年构建人形机器人的机器人先驱建议你与任何全尺寸步行机器人保持至少九英尺的距离时,你可能应该认真听取这个建议。
"我的建议是,人们不要靠近全尺寸步行机器人3米以内,"Rodney Brooks在他上周发表在博客上的技术论文《为什么当今的人形机器人无法学习灵巧操作》中写道,"直到有人开发出更安全的双足步行机器人版本,即使靠近甚至接触也安全,否则我们不会看到人形机器人在有人类存在的区域获得部署认证。"
Brooks是MIT荣誉退休教授,联合创立了iRobot(以Roomba闻名)和Rethink Robotics,他认为向人形开发投入数十亿美元的公司正在追逐一个昂贵的幻想。除了尚未解决的其他问题外,他警告说,当今的双足人形机器人在行走时,由于维持平衡时产生的巨大动能,从根本上对附近的人类不安全。如果机器人摔倒或其肢体击中某人,这种储存的能量可能导致严重伤害。
触觉感知的缺失:机器人灵巧操作的关键障碍
除了危险问题,Brooks还反驳了当前流行的观点,即人形机器人将通过观看人们执行任务的视频来学习灵巧操作,从而很快取代人类工人。这是一种我们过去报道过的常见机器人AI训练技术。他认为这样的机器人并非不可能实现,但可能比大多数人想象的要遥远得多。
在科技世界的某些领域,随着AI的快速发展,机器人炒作已达到狂热程度。特斯拉CEO埃隆·马斯克曾声称,公司的Optimus机器人可能创造30万亿美元的营收,而Figure的CEO Brett Adcock则设想人形机器人在劳动力中执行数百万项任务。
然而,硬件比软件难得多。与在虚拟世界中运行的软件不同,物理定律是无情且不可改变的,安全地与物理世界交互需要大量的感官输入。自1970年代以来一直从事机器人操作研究的Brooks认为,这些公司忽略了灵巧操作的基本要素:触觉。
Brooks论点的核心在于像特斯拉和Figure这样的公司如何训练他们的机器人。两家公司都公开表示他们仅使用视觉方法,让工人佩戴相机设备来记录折衬衫或拾取物体等任务。然后这些数据被输入AI模型,可以在新情境中模仿动作的变体。特斯拉最近已从动作捕捉服和远程操作转向基于视频的方法,工人佩戴装有五个相机的头盔和背包。Figure的"Project Go-Big"倡议同样依赖于直接从他们所谓的"日常人类视频"中转移知识。
除了从真实人类执行任务的视频捕捉外,一些机器人AI模型还使用物理空间的模拟进行训练,这些模拟也有类似的局限性。
Brooks认为,这些方法忽视了数十年的研究,这些研究表明人类的灵巧操作依赖于一个极其复杂的触觉传感系统。他引用了于默奥大学Roland Johansson实验室的研究,显示当一个人的指尖被麻醉时,一个七秒的拾取和点燃火柴的任务会延长到近30秒的笨拙摸索。人类手部大约有17,000个机械感受器,仅每个指尖就有1,000个。哈佛大学David Ginty实验室的最新研究已确定了15个参与触觉感知的神经元家族,可以检测从轻微凹陷到振动再到皮肤拉伸的各种感觉。这是当前机器人系统尚未捕捉或模拟的大量感官信息。
机器人物理学的危险
除了灵巧操作问题,还有一个更紧迫的安全隐患。当前的人形机器人使用强大的电动机和一种称为零力矩点(Zero Moment Point)的数十年-old算法来维持平衡,当检测到不稳定时,会将大量能量泵入系统。这种方法在大多数情况下足以保持它们直立,但它创造了Brooks描述的与人类接近的根本性不兼容。
物理学的尺度定律使得全尺寸人形机器人比其小型 counterparts 危险得多。Brooks说,当你将机器人的尺寸增加一倍时,其质量会增加八倍。这意味着一个摔倒的全尺寸人形机器人具有半尺寸版本八倍的动能。如果在摔倒过程中,那个快速加速的金属腿遇到路径中的任何物体,撞击可能导致严重伤害。
在他的文章中,Brooks回忆起几年前在Agility Robotics Digit人形机器人摔倒时"靠得太近"。自那以后,他就不敢在机器人行走时靠近它们。Brooks指出,即使在人形公司的宣传视频中,除非有家具隔开,否则人类从未被 shown 靠近移动的人形机器人,即使如此,机器人也只是最小限度地挪动。
这个安全问题不仅限于意外摔倒。为了让人形机器人在医疗保健和工厂环境中履行其承诺的角色,它们需要在与人类共享的区域获得认证。当前的行走机制使得在世界大多数地区现有的安全标准下,这种认证几乎不可能实现。
未来机器人:超越双足设计
Brooks预测,在未来15年内,确实会有许多被称为"人形"的机器人执行各种任务。但具有讽刺意味的是,它们将与当今的双足机器人大相径庭。它们将有轮子而不是脚,不同数量的手臂,以及与人类眼睛毫无相似之处的专用传感器。一些机器人会在手中或从躯干中部向下安装摄像头。"人形"的定义将会转变,就像"飞行汽车"现在意味着电动直升机而非道路飞行器,"自动驾驶汽车"意味着有远程人类监控的车辆而非真正自主的系统。
Brooks认为,当前投入数十亿美元强迫当今的刚性、仅视觉人形机器人学习灵巧操作的资金将 largely 消失。学术研究人员在整合触觉反馈的系统方面取得了更大进展,如MIT使用手套在人类操作员和机器人手之间传递感觉的方法。但即使这些进步仍然远远无法实现人类灵巧操作所需的全面触觉感知。
今天,很少有人整天待在人形机器人附近,但Brooks的三米规则作为一个实用的警告,来自一位构建这些机器数十年的专家,提醒我们前方面临的挑战。宣传视频与可部署现实之间的差距仍然很大,这不仅以年为单位衡量,还体现在物理、感知和安全等基本未解决的问题上。