HOVER – 英伟达1.5M小模型引爆人形机器人革命

3

人形机器人,这个曾经只存在于科幻小说和电影中的概念,如今正以惊人的速度走进现实。而在这场科技革命中,英伟达(NVIDIA)无疑扮演着举足轻重的角色。近日,英伟达推出了一款名为HOVER的通用人形机器人功能控制器,再次引发了业界的高度关注。这款仅有1.5M大小的小模型,却蕴含着巨大的潜力,它将如何改变人形机器人的未来?

HOVER,全称为“Humanoid Versatile Controller”,顾名思义,是一款旨在实现人形机器人多功能、全身神经控制的通用控制器。它以其小巧的体积和强大的功能,重新定义了人形机器人控制系统的可能性。HOVER的核心在于其能够以150万参数实现对机器人复杂动作的精准控制,并且能够适应导航、桌面操作和移动操作等多样化的任务需求。更令人惊叹的是,HOVER并非针对特定任务进行优化,而是通过模仿全身运动作为一种通用的抽象,从而提供通用的运动技能,并在此基础上学习各种全身控制模式。

AI快讯

那么,HOVER究竟有哪些令人瞩目的功能呢?

多模式控制,灵活应对复杂场景

传统的人形机器人控制系统往往针对特定任务进行设计,难以适应复杂多变的环境。而HOVER则打破了这一局限,它能够无缝切换不同的控制模式,例如导航、桌面操作和移动操作等。每种模式都针对特定的控制需求进行了优化,从而确保机器人在各种场景下都能高效、精准地完成任务。这意味着,未来的人形机器人将不再是只能执行单一任务的“机器”,而是能够像人类一样,根据环境的变化灵活调整自身的行为。

精确的位置和角度跟踪,实现精细动作控制

对于人形机器人而言,精确的运动控制至关重要。HOVER支持对机器人关键部位的3D位置进行跟踪,从而实现精确的运动复制。此外,HOVER还能跟踪每个机器人电机的目标关节角度,从而实现复杂的肢体动作。这意味着,人形机器人不仅能够完成简单的行走、跑步等动作,还能进行更加精细的操作,例如抓取物体、操作工具等。

根跟踪技术,保持平衡和动态运动

保持平衡和执行动态动作是人形机器人面临的一大挑战。HOVER通过根跟踪技术,能够跟踪机器人的根速度、高度和方向,从而确保机器人在运动过程中保持平衡。这项技术对于人形机器人在复杂环境中行走、跑步,甚至进行跳跃等动作至关重要。

统一的命令空间,兼容多种控制设备

为了方便用户进行控制,HOVER设计了统一的命令空间,能够兼容各种控制设备,例如操纵杆、动作捕捉系统、外骨骼和虚拟现实头设。这意味着,用户可以通过自己熟悉的设备来控制人形机器人,无需学习新的操作方式。这无疑大大降低了人形机器人的使用门槛,使其能够更快地普及。

策略蒸馏技术,提高效率和灵活性

HOVER采用了多模式策略蒸馏框架,将不同控制模式整合到统一的策略中,实现了模式间的无缝切换,并且保留了每种模式的优势。简单来说,HOVER就像一位经验丰富的“老师”,它能够从各种“专家”策略中学习,并将这些策略的精华融合到一起,形成一种更加高效、灵活的“通用策略”。

HOVER之所以能够实现如此强大的功能,离不开其独特的技术原理。

本体感觉和命令屏蔽,实现精准控制

HOVER基于本体感觉(机器人自身的状态感知)和命令屏蔽(选择性激活不同的命令空间)来确定任务命令,从而支持独立控制机器人的上半身和下半身。这意味着,HOVER能够像人类一样,同时进行多项任务,例如在行走的同时进行手部操作。

多模式策略蒸馏框架,学习人类运动

HOVER利用策略蒸馏技术,将从大规模人类运动数据中学习到的Oracle策略转化为能够处理多种控制模式的单一策略。这意味着,HOVER能够学习人类的运动方式,从而使机器人的动作更加自然、流畅。

DAgger框架,优化学生策略

HOVER采用DAgger(Dataset Aggregation)框架对齐学生策略和Oracle策略的动作,并基于监督学习优化学生策略。简单来说,DAgger框架就像一位耐心的“教练”,它会不断地比较学生策略和Oracle策略的差异,并指导学生策略进行改进,从而使其更加接近Oracle策略。

模拟训练,加速模型部署

HOVER的训练在NVIDIA Isaac模拟套件中进行。该套件基于GPU加速,能够快速模拟长时间的训练,从而加速模型的开发和部署。更重要的是,通过模拟训练,HOVER能够将模型迁移到现实世界中,无需额外的微调。这大大降低了人形机器人的开发成本,使其能够更快地应用于实际场景。

统一命令空间设计,适应各种控制配置

HOVER的命令空间设计既通用又原子,能够覆盖大多数现有的控制配置,并且能够任意组合以支持各种模式。这意味着,HOVER能够兼容各种不同的机器人平台和控制设备,从而使其具有更广泛的适用性。

运动重定向,生成机器人动作数据

HOVER能够将人类动作数据集重定向为机器人动作数据集,并基于匹配关键点和优化参数来实现。这意味着,HOVER能够利用现有的丰富的人类动作数据来训练机器人,从而加快机器人的学习速度。

那么,HOVER究竟能够应用于哪些场景呢?

导航与移动,助力智能出行

HOVER能够控制人形机器人在复杂环境中进行导航和移动,例如在不平坦的地面上行走或在狭窄的空间中穿梭。这使其能够应用于搜索救援、导览服务等场景,为人们的生活带来便利。

桌面操作,提升工作效率

在需要精细操作的桌面任务中,例如组装电子元件或进行实验室工作,HOVER能够精确控制机器人的上肢和手部关节,从而实现复杂的手眼协调操作。这能够大大提高工作效率,降低人工成本。

移动操作(Loco-manipulation),实现复杂任务

HOVER能够协调机器人的全身动作,实现流畅的搬运和操作任务。这意味着,人形机器人能够在移动过程中抓取和搬运物体,从而完成更加复杂的任务。

人机交互,创造全新体验

HOVER支持各种输入设备(例如VR头盔、动作捕捉系统、外骨骼)进行人机交互,从而让机器人能够模仿人类的动作和行为。这使其能够应用于娱乐、教育和培训等领域,为人们带来全新的体验。

远程操作与仿真,保障安全生产

在远程操作场景中,HOVER能够实时响应操作者的指令,执行精确的远程任务,例如远程手术辅助或危险环境作业。这能够大大降低人员伤亡的风险,保障安全生产。

英伟达HOVER的出现,无疑为人形机器人领域注入了新的活力。它以其小巧的体积、强大的功能和广泛的应用前景,预示着人形机器人时代的到来。未来,我们有理由相信,随着技术的不断进步,人形机器人将会在更多领域发挥重要作用,为人类创造更加美好的生活。