在人工智能领域,扩展AI能力一直是研究者和工程师们追求的目标。传统的扩展方式包括增加训练数据、提升训练时计算能力和测试时计算能力。然而,随着技术的不断进步,一种新的扩展方式正在崭露头角——并行智能体。这种通过让多个智能体同时运行来进一步扩展和提升AI性能的技术,正逐渐成为AI发展的重要方向。
并行智能体的兴起
AI模型的能力扩展一直是可预测的。百度前团队的研究以及后来的OpenAI研究表明,AI模型的性能随着数据和训练计算量的增加而提升。而测试时计算,如在智能体工作流和推理模型中的应用,也能进一步提高性能。但这些方法通常需要更长的运行时间才能产生输出。并行智能体则提供了另一条提高结果的路径,同时不会让用户等待更长时间。
推理模型是顺序生成标记的,运行时间可能很长。同样,大多数智能体工作流最初也是以顺序方式实现的。但随着每个标记的LLM价格持续下降,这些技术变得实用,产品团队希望更快地向用户提供结果,越来越多的智能体工作流正在被并行化。
实际应用案例
并行智能体的应用已经在多个领域展现出其价值:
研究智能体的并行处理
许多研究智能体现在会同时获取多个网页并并行检查其文本,以尝试更快地合成深度思考的研究报告。这种方法显著提高了信息处理的效率,使研究过程更加迅速和全面。
代码框架中的多智能体协作
一些智能体编码框架允许用户编排多个智能体同时处理代码库的不同部分。我们的Claude Code短期课程展示了如何使用git worktrees实现这一点,展示了如何让多个智能体协同工作,共同完成复杂的编码任务。
设计模式中的监控与反馈
一个快速增长的智能体工作流设计模式是让一个计算密集型智能体工作数分钟或更长时间来完成一项任务,同时另一个智能体监控第一个智能体并向用户提供简要更新,以保持他们了解情况。从这里出发,智能体可以在后台工作,而UI智能体保持用户信息畅通,并将异步用户反馈路由到其他智能体,这只是一个简短的步骤。
技术挑战与机遇
任务分解的挑战
对于人类管理者来说,将复杂任务(如构建复杂软件应用程序)分解为更小的任务,让人类工程师并行工作是很困难的;扩展到大量工程师尤其具有挑战性。同样,为并行智能体分解任务也具有挑战性。但LLM推理成本的下降使得使用更多的标记变得值得,而并行使用这些标记可以在不显著增加用户等待时间的情况下实现这一点。
成本下降带来的机遇
随着大语言模型推理成本的持续下降,并行智能体技术变得更加经济可行。这使得开发者和研究人员能够利用更多的计算资源,同时保持用户体验的流畅性。成本效益的提升将进一步推动并行智能体技术的广泛应用和创新。
研究进展
并行智能体领域的研究正在迅速发展。例如,Ryan Ehrlich等人撰写的《CodeMonkeys: Scaling Test-Time Compute for Software Engineering》展示了并行代码生成如何帮助探索解决方案空间,为软件工程领域提供了新的思路。
Junlin Wang提出的混合智能体(mixture-of-agents)架构是组织并行智能体的出奇简单的方法:让多个LLM提出不同的答案,然后让聚合LLM将它们组合成最终输出。这种方法不仅简单有效,还为并行智能体的组织提供了一种新的范式。
未来展望
并行智能体领域仍有大量的研究和工程探索空间,以确定如何最好地利用并行智能体。我相信,能够有效并行工作的智能体数量——就像能够有效并行工作的人类一样——将会非常高。
随着技术的不断进步和应用场景的拓展,并行智能体有望在AI系统中扮演越来越重要的角色。它们不仅可以提高AI系统的效率和性能,还可以为解决更复杂的问题提供新的思路和方法。未来的AI系统可能会更加依赖并行智能体的协同工作,以实现更高级的认知功能和任务处理能力。
结论
并行智能体作为一种新兴的AI扩展方向,正在为人工智能的发展开辟新的可能性。通过同时运行多个智能体,我们可以在不显著增加用户等待时间的情况下提高AI系统的性能和效率。从研究智能体到代码框架,从监控反馈到解决方案探索,并行智能体的应用正在各个领域展现出其价值。
尽管面临任务分解等挑战,但随着LLM推理成本的下降和相关研究的深入,并行智能体技术将变得更加成熟和普及。我们有理由相信,并行智能体将成为未来AI系统的重要组成部分,推动人工智能技术向更高水平发展,为人类社会带来更多的创新和价值。

并行智能体的工作流程展示了多个智能体如何协同工作,共同完成任务,提高整体效率。









