机器人芭蕾舞:DeepMind如何革新制造业AI协调系统

1

现代制造业中,我们使用的许多产品都是由机器人制造的——这些多自由度机械臂沿着传送带排列,以精确同步的动作进行工作,形成一场壮观的机械芭蕾。这些动作通常需要手动编程,耗时可达数百至数千小时。谷歌DeepMind团队开发的AI系统RoboBallet,让制造机器人能够自主决定如何执行任务。

旅行推销员问题的超级挑战

规划制造机器人如何高效完成任务是一项难以自动化的挑战。你需要解决任务分配和调度问题——决定哪个机器人应该以何种顺序执行哪个任务。这就像是著名的旅行推销员问题的强化版。此外,还有运动规划的问题;你需要确保所有这些机械臂不会相互碰撞,也不会撞到周围的设备。

最终,你面临着无数种可能的组合,必须同时解决三个计算难题,而非一个。谷歌DeepMind的研究工程师Matthew Lai表示:"有一些工具可以自动化运动规划,但任务分配和调度通常需要手动完成。解决这三个问题的结合正是我们工作的重点。"

Lai的团队首先生成了所谓的"工作单元"的模拟样本,这些是机器人团队在制造产品上执行任务的区域。工作单元包含一个称为"工件"的产品,在这个案例中,这是一个由铝制支架组成的结构,放置在桌子上。桌子周围随机放置了多达八个Franka Panda机械臂,每个都有7个自由度,需要在工件上完成最多40个任务。每个任务都需要机械臂的末端执行器到达正确支架的正确位置,角度正确,然后在那一刻保持静止,模拟执行某些工作。

为了增加难度,团队在每个工作单元中随机放置了障碍物,机器人需要避开它们。Lai解释说:"我们选择最多使用8个机器人,因为这是在紧密打包机器人而不让它们相互阻挡的合理最大数量。"让机器人在工件上执行40个任务也是团队认为能代表实际工厂需求的设置。

使用最强大的强化学习算法处理这样的设置将是一场噩梦。Lai和他的同事找到了一种解决方法,将所有问题转化为图结构。

复杂关系网络

在Lai的模型中,图由节点和边组成。机器人、任务和障碍物被视为节点。它们之间的关系被编码为单向或双向边。单向边连接机器人与任务和障碍物,因为机器人需要了解障碍物的位置以及任务是否完成。双向边连接机器人之间,因为每个机器人需要知道其他机器人在每个时间步的动向,以避免碰撞或重复任务。

为了读取和理解这些图,团队使用了图神经网络,这是一种人工智能,通过沿着节点之间的连接边传递消息来提取节点间的关系。这简化了数据,使研究人员能够设计一个专注于最重要事项的系统:在导航障碍物的同时找到完成任务的最有效方式。经过几天在单个Nvidia A100 GPU上使用随机生成的工作单元进行训练后,这个名为RoboBallet的新工业规划AI能够在几秒钟内为复杂且前所未见的环境规划出看似可行的轨迹。

但最重要的是,它的扩展性非常好。

规模经济效应

将传统计算方法应用于复杂问题(如管理工厂中的机器人)的挑战在于,计算难度随系统中项目数量呈指数级增长。为一个机器人计算最优轨迹相对简单。为两个机器人做同样的事情要困难得多;当数量增加到八个时,问题变得实际上无法解决。

使用RoboBallet,计算复杂度也随系统复杂度增长,但速度慢得多。(计算量随任务和障碍物数量线性增长,随机器人数量二次增长。)据团队称,这些计算应该使系统在工业规模应用中变得可行。

然而,团队想要测试他们的AI产生的计划是否有效。为了验证这一点,Lai和他的同事在一些简化的工作单元中计算了最优的任务分配、调度和运动轨迹,并与RoboBallet的结果进行了比较。在执行时间方面——这可能是制造中最重要的指标——AI的表现非常接近人类工程师的水平。它并不比他们做得更好,只是提供答案的速度更快。

团队还在真实物理环境中测试了RoboBallet的规划,使用四个Panda机器人处理铝制工件,结果与模拟中一样有效。但Lai表示,它不仅可以加速机器人编程过程。

应对突发状况

根据DeepMind团队的说法,RoboBallet还使我们能够设计更好的工作单元。Lai说:"因为它工作得非常快,设计师几乎可以实时尝试不同的布局以及机器人的不同放置或选择。"这样,工厂工程师就能准确了解通过在工作单元中添加另一个机器人或选择不同类型的机器人可以节省多少时间。RoboBallet可以做的另一件事是动态重新编程工作单元,允许其他机器人在其中一个机器人故障时接替工作。

尽管如此,在RoboBallet进入工厂之前,仍有一些问题需要解决。Lai承认:"我们做了几个简化。"首先是障碍物被分解为立方体。工件本身也是立方体的。虽然这在某种程度上代表了实际工厂中的障碍物和设备,但许多可能的工件具有更有机的形状。Lai说:"用更灵活的方式表示它们,如网格图或点云会更好。"然而,这可能意味着RoboBallet惊人的速度会下降。

另一点是,Lai实验中的机器人是相同的,而在实际工作单元中,机器人团队通常是异构的。Lai说:"这就是为什么实际应用需要针对特定应用类型进行额外的研究和工程。"但他补充说,当前的RoboBallet已经考虑了此类适应性——可以轻松扩展以支持它们。一旦完成,他希望这将使工厂更快且更加灵活。

Lai表示:"系统需要提供工作单元模型、工件模型以及需要执行的任务列表——基于这些,RoboBallet将能够生成完整的计划。"

技术突破与行业影响

RoboBallet代表了工业自动化领域的重要突破。通过将复杂的机器人协调问题转化为图结构并利用图神经网络,DeepMind团队创造了一种能够处理高度复杂环境的方法。这种技术的核心优势在于它能够同时考虑三个关键因素:任务分配、调度和运动规划,而传统方法通常需要分别处理这些方面。

在工业环境中,这意味着生产线的设置时间可以从数千小时缩短到几分钟。工厂设计师可以快速尝试不同的配置,找到最优的生产布局。这种灵活性对于现代制造业至关重要,因为产品生命周期缩短,定制化需求增加,工厂需要能够快速调整生产流程。

此外,RoboBallet的实时重新编程能力为制造业带来了新的可能性。当机器人出现故障时,系统可以立即重新分配任务,最小化生产中断。这种弹性对于维持高生产效率和降低维护成本至关重要。

未来发展方向

尽管RoboBallet取得了显著进展,但仍有一些领域需要进一步发展。首先,正如Lai所指出的,当前系统主要处理立方体形状的障碍物和工件。扩展到更复杂的几何形状将需要更灵活的表示方法,这可能影响系统的实时性能。

其次,异构机器人系统的集成是一个重要挑战。实际工厂环境中,不同类型、不同能力的机器人经常需要协同工作。开发能够处理这种多样性的算法将使RoboBallet更具实用性。

另一个研究方向是提高系统的适应能力。当前的系统需要预先定义任务和环境模型。未来的版本可能需要具备更强的学习能力,能够从经验中改进,甚至处理任务定义不完整或动态变化的情况。

结论

DeepMind的RoboBallet代表了制造业AI协调系统的重要进步。通过创新的图神经网络方法,它解决了多机器人环境中的复杂协调问题,为工业自动化带来了新的可能性。尽管仍需克服一些技术挑战,但这一系统的潜力巨大,有望引领制造业进入更加智能、高效和灵活的新时代。随着技术的进一步发展和完善,我们可以期待看到更多工厂采用这种先进的AI协调系统,重新定义现代制造业的面貌。