当一位在构建人形机器人领域工作了几十年的先驱建议你与任何全尺寸步行机器人保持至少九英尺的距离时,你 probably应该听从这个建议。
"我的建议是,人们不要靠近全尺寸步行机器人3米以内,"Rodney Brooks在他上周发表在博客上的技术论文《为什么今天的人形机器人无法学习灵巧操作》中写道。"直到有人开发出更安全的双足步行机器人版本,即使靠近甚至接触也相对安全,否则我们将无法看到人形机器人在有人类存在的区域获得部署认证。"
Brooks是麻省理工学院荣誉教授,联合创立了iRobot(以Roomba吸尘器闻名)和Rethink Robotics公司。他认为,向人形机器人开发投入数十亿美元的公司正在追逐一个昂贵的幻想。除了其他尚未解决的问题外,他警告称,当今的双足人形机器人在行走时对人类来说本质上是不安全的,因为它们在保持平衡时会产生巨大的动能。这种储存的能量如果机器人摔倒或其肢体撞击到人,可能导致严重伤害。
触觉感知的缺失:机器人灵巧操作的关键瓶颈
除了危险问题,Brooks还质疑当前流行的观点,即人形机器人将通过观看人类执行任务的视频很快学习灵巧操作来替代人类工人。这是一种常见的机器人AI训练技术,我们过去曾报道过。他不认为这样的机器人不可能实现,但它们可能比大多数人想象的要遥远得多。
在科技世界的某些领域,随着AI的快速发展,机器人炒作已经达到了狂热的程度。特斯拉CEO埃隆·马斯克曾声称,公司的Optimus机器人可能创造30万亿美元的收入,而Figure CEO Brett Adcock则设想人形机器人在劳动力中执行数百万项任务。
然而,硬件比软件要难得多。与在虚拟世界中运行的软件不同,物理定律是无情且不可改变的,安全地与物理世界互动需要大量的感官输入。自1970年代以来一直从事机器人操作研究的Brooks认为,这些公司忽视了灵巧操作的基本要素:触觉。
Brooks论点的核心在于像特斯拉和Figure这样的公司如何训练他们的机器人。两家公司都公开表示他们采用纯视觉方法,让工人佩戴相机设备记录折衣服或捡取物品等任务。然后,这些数据被输入AI模型,可以在新情境中模仿动作的各种变化。特斯拉最近从动作捕捉服和远程操作转向基于视频的方法,工人佩戴配备五个相机的头盔和背包。Figure的"Project Go-Big"倡议同样依赖于直接从他们所谓的"日常人类视频"中转移知识。
除了真实人类执行任务的视频捕捉外,一些机器人AI模型还使用物理空间的模拟进行训练,这些模拟存在类似的局限性。
Brooks认为,这些方法忽视了数十年的研究,这些研究表明人类的灵巧操作依赖于一个极其复杂的触觉传感系统。他引用了于默奥大学Roland Johansson实验室的研究显示,当一个人的指尖被麻醉时,拿起并点燃火柴的七秒任务会延长到近30秒的笨拙摸索。人手大约含有17,000个机械感受器,仅每个指尖就有1,000个。哈佛大学David Ginty实验室的最新研究确定了15个参与触觉感知的神经元家族,能检测从轻微凹陷到振动再到皮肤拉伸的各种感觉。这是当前机器人系统尚无法捕捉或模拟的大量感官信息。
跌倒机器人的物理学
在灵巧操作问题之外,存在着一个更加紧迫的安全问题。当前的人形机器人使用强大的电机和一种称为零力矩点(ZMP)的古老算法来维持平衡,当检测到不稳定时,会将大量能量泵入系统。这种方法足以在大多数情况下保持它们直立,但它创造了Brooks所描述的与人类接近的根本不兼容性。
物理学的尺度定律使得全尺寸人形机器人比其小型 counterparts 危险得多。Brooks说,当机器人尺寸翻倍时,其质量会增加八倍。这意味着一个摔倒的全尺寸人形机器人具有半尺寸版本八倍的动能。如果那个快速加速的金属腿在摔倒过程中遇到路径上的任何障碍物,撞击可能造成严重伤害。
在他的文章中,Brooks回忆起几年前当Agility Robotics的Digit人形机器人摔倒时,他"靠得太近"。从那以后,他不敢再接近一个行走的机器人。Brooks指出,即使在人形公司的宣传视频中,除非被家具隔开,否则人类也从未被展示在移动的人形机器人附近,即使如此,机器人也只是最小限度地移动。
这个安全问题不仅限于意外跌倒。为了让人形机器人实现其在医疗和工厂环境中的承诺角色,它们需要获得在人类共享区域运营的认证。当前的行走机制使得在世界大多数地区现有的安全标准下,这种认证几乎不可能实现。
未来机器人:重新定义"人形"
Brooks预测,在未来15年内,确实会出现许多被称为"人形"的机器人执行各种任务。但具有讽刺意味的是,它们将看起来与今天双足机器人大相径庭。它们将使用轮子而非脚,具有不同数量的手臂,以及与人类眼睛毫无相似之处的专用传感器。一些将在手掌中或从躯干中部向下安装摄像头。"人形"的定义将发生变化,就像"飞行汽车"现在意味着电动直升机而非道路可飞行的飞机,"自动驾驶汽车"意味着具有远程人类监控的车辆而非真正自主的系统。
Brooks认为,当前强迫今天僵硬的纯视觉人形机器人学习灵巧操作的数十亿美元投资将 largely 消失。学术研究人员在整合触觉反馈的系统方面取得了更多进展,例如麻省理工学院使用手套在人类操作员和机器人手之间传递感觉的方法。但即使这些进步仍然远未实现人类灵巧操作所需的全面触觉感知。
今天,很少有人整天待在人形机器人附近,但Brooks的3米规则作为一位构建这些机器数十年的专家提出的实用警告,预示着未来的挑战。宣传视频与可部署现实之间的差距仍然很大,这不仅以年计算,还体现在物理学、感知和安全的基本未解决问题上。