当一位在机器人领域工作数十年的先驱建议你与全尺寸行走机器人保持至少三米距离时,你或许应该认真对待这番忠告。
"我建议人们不要靠近全尺寸行走机器人3米以内,"Rodney Brooks在他博客上发表的技术论文《为什么当今的人形机器人无法学习灵巧操作》中写道。"直到有人开发出更安全的双足行走机器人版本,即使靠近甚至接触也不会造成危险,否则我们不会看到人形机器人在有人类存在的区域获得认证并部署。"
Brooks是麻省理工学院荣誉教授,也是iRobot(以Roomba吸尘器闻名)和Rethink Robotics的联合创始人。他认为,投入数十亿美元开发人形机器人的公司正在追逐一个昂贵的幻想。除其他尚未解决的问题外,他警告说,当今的双足人形机器人在行走时产生的巨大动能使其对人类存在根本性的安全隐患。如果机器人摔倒或其肢体撞击到人,这种储存的能量可能导致严重伤害。
触觉感知:机器人灵巧性的关键
除了故障风险外,Brooks还质疑当前普遍认为人形机器人将通过观看人类执行任务的视频来学习灵巧操作并很快取代人类工人的观点。这是一种过去我们报道过的常见机器人AI训练技术。Brooks并非认为这样的机器人不可能实现,而是它们可能比大多数人想象的要遥远得多。
在科技世界的某些领域,随着AI的快速发展,机器人炒作已经达到了狂热的程度。特斯拉CEO埃隆·马斯克声称公司的Optimus机器人可能产生30万亿美元的收入,而Figure CEO Brett Adcock则设想人形机器人在劳动力中执行数百万项任务。
然而,硬件比软件要困难得多。与在虚拟世界中运行的软件不同,物理定律是无情且不可改变的,而安全地与物理世界互动需要大量的感官输入。自1970年代以来一直从事机器人操作研究的Brooks认为,这些公司忽视了灵巧操作的基本要素:触觉。
Brooks论点的核心在于像特斯拉和Figure这样的公司如何训练他们的机器人。两家公司都公开表示他们仅使用视觉方法,让工人佩戴相机设备记录折叠衬衫或拾取物体等任务的数据。然后将这些数据输入AI模型,这些模型可以在新情境中模仿动作的各种变化。特斯拉最近已从动作捕捉服和远程操作转向基于视频的方法,工人佩戴配备五个摄像头的头盔和背包。Figure的"Project Go-Big"计划同样依赖于直接从他们所谓的"日常人类视频"中转移知识。
除了从真实人类执行任务的视频捕捉外,一些机器人AI模型还使用物理空间的模拟进行训练,这些模拟存在类似的局限性。
Brooks认为,这些方法忽视了数十年的研究,这些研究表明人类的灵巧操作依赖于一个极其复杂的触觉传感系统。他引用于默奥大学Roland Johansson实验室的研究显示,当一个人的指尖被麻醉时,拾取并点燃火柴的七秒任务会延长到近30秒的笨拙操作。人类手部大约有17,000个机械感受器,仅每个指尖就集中了1,000个。哈佛大学David Ginty实验室的最新研究确定了15个参与触觉感知的神经元家族,这些神经元能检测从轻微压痕到振动再到皮肤拉伸的各种感觉。这是当前机器人系统尚无法捕捉或模拟的大量感官信息。
机器人摔倒的物理风险
除了灵巧性问题,还有一个更紧迫的安全隐患。当前的人形机器人使用强大的电机和一种称为零力矩点(Zero Moment Point)的古老算法来维持平衡,在不稳定检测到时向系统注入大量能量。这种方法足以使它们大多数时间保持直立,但它创造了Brooks所描述的与人类接近的根本不兼容性。
物理定律的尺度效应使得全尺寸人形机器人比其小型 counterparts 危险得多。Brooks表示,当机器人尺寸翻倍时,其质量会增加八倍。这意味着一个摔倒的全尺寸人形机器人具有半尺寸版本八倍的动能。如果在摔倒过程中,这个加速的金属腿遇到任何障碍物,撞击可能导致严重伤害。
在他的文章中,Brooks回忆几年前在Agility Robotics的Digit人形机器人摔倒时"靠得太近"。从那以后,他再也不敢接近行走的机器人。Brooks指出,即使在人形公司的宣传视频中,除非被家具隔开,否则人类也从未被展示靠近移动的人形机器人,即使如此,机器人也只是最小限度地移动。
这种安全问题不仅限于意外摔倒。为了让人形机器人履行其在医疗保健和工厂环境中的承诺角色,它们需要在有人类存在的区域获得认证。当前的行走机制使得在世界上大多数地区现有的安全标准下,这种认证几乎不可能实现。
人形Apollo机器人。图片来源:Google
机器人形态的未来演变
Brooks预测,在15年内,确实会有许多被称为"人形"的机器人执行各种任务。但具有讽刺意味的是,它们将与当今的双足机器人大不相同。它们将有轮子而不是脚,不同数量的手臂,以及与人类眼睛毫无相似之处的专用传感器。一些机器人会在手中或从躯干中部安装摄像头。"人形"的定义将会转变,就像"飞行汽车"现在意味着电动直升机而非道路飞行器,"自动驾驶汽车"意味着配备远程人类监控的车辆而非真正自主的系统一样。
Brooks认为,当前强迫当今的刚性、仅依赖视觉的人形机器人学习灵巧操作的数十亿美元投资将 largely 消失。学术研究人员在整合触觉反馈的系统方面取得了更多进展,例如麻省理工学院使用的手套,可以在人类操作员和机器人手之间传递感觉。但即使这些进展仍然远未达到实现人类灵巧操作所需的全面触觉感知。
如今,很少有人整天呆在人形机器人附近,但Brooks的三米规则作为一个实际警告,来自一位几十年来一直在构建这些机器的人。宣传视频与可部署现实之间的差距仍然很大,这不仅以年为单位衡量,还以物理、感知和安全的基本未解决问题来衡量。
行业反思与前瞻
Brooks的观点为当前人形机器人热潮提供了一个重要的平衡视角。虽然AI的进步确实令人兴奋,但我们必须认识到,物理世界的约束比数字世界更为严格。机器人不仅需要"思考",还需要"感受"和"行动",这三者之间的协调远比当前技术所能实现的要复杂。
触觉感知的研究或许是人形机器人发展中最被低估的领域。人类之所以能够灵巧地操作物体,不仅依赖于视觉,更依赖于触觉提供的丰富反馈。这种反馈让人类能够调整握力、感知物体纹理、预测物体行为,这些都是当前机器人系统难以企及的能力。
此外,Brooks对安全问题的关注提醒我们,机器人的发展不应只关注功能实现,还应考虑与人类共存的安全标准。或许,在追求"人形"外观的同时,我们更应该关注机器人与人类安全交互的根本设计原则。
未来的人形机器人可能不会像今天这样模仿人类的每一步动作,而是会发展出更适合特定任务的形态。正如Brooks所预测的,它们可能拥有轮子而非双脚,配备特殊传感器而非模仿人类感官,拥有专门设计的机械手而非模仿人类双手。这种演变不是失败,而是对物理现实和实际需求的理性回应。
结语
Rodney Brooks的警告并非要阻止机器人技术的发展,而是呼吁行业在追求创新的同时,保持对物理现实和安全考量的尊重。人形机器人的未来可能比我们想象的更加多样化,更加适应特定任务的需求,而非简单地模仿人类形态。
在机器人技术快速发展的今天,Brooks的观点为我们提供了一个重要的平衡视角,提醒我们技术进步必须与安全、实用性和伦理考量相结合。或许,真正成功的机器人不是那些最像人类的,而是那些能够最好地完成特定任务并安全地与人类共存的。