AI办公的未来:Agnes如何用多智能体协作挑战微软Office?

1

AI办公新纪元:新加坡博士团队的Agnes如何挑战微软Office?

在人工智能的浪潮下,办公领域正经历着前所未有的变革。微软Office Copilot的发布,无疑是这场变革的开端。然而,Copilot仅仅停留在“智能助手”的层面,未能从根本上解决软件割裂、缺乏上下文记忆与协作能力等问题。与此同时,Manus和Genspark等AI原生平台,虽然致力于提供更轻量级的办公体验,但依然受限于协作功能和编辑灵活性。面对这些挑战,一群来自新加坡的博士团队提出了全新的解决方案——Agnes,试图打破AI办公领域的现有僵局,重塑任务分工和信息流转,让AI真正成为团队的智能中枢。

Agnes:多智能体驱动的全新协作Workspace

大多数AI办公工具往往只关注文档本身,侧重于单人任务。一旦涉及到需要多轮次、跨成员参与的复杂团队协作,便显得力不从心。在团队协作场景下,AI需要处理的信息量呈指数级增长,这给超长上下文理解、复杂工具调用以及版本控制与冲突解决带来了巨大的挑战。Agnes正是在此背景下应运而生,它构建了一个具备多人协作能力的原生AI办公平台,可以完成撰写文章、研究报告、制作PPT等基础办公任务。团队成员无需在多个应用和界面之间频繁切换,所有输入输出、协作与任务进展都集中在一个具备记忆能力的统一工作空间中。

协作工作空间

Agnes的核心特性主要体现在以下三个方面:

  1. 真正的协作型AI工作空间:Agnes构建了一个深度适配团队协作场景的AI工作中台,融合了团队记忆、智能体分工和一体化内容生成。这使得任务推进和信息传递能够围绕实际协作流程展开,而非零散的输入输出。

  2. 多人实时协作编辑:Agnes支持团队成员实时编辑文档、报告和演示内容,所有修改即时可见,提供接近Google Docs的流畅协作体验,显著优于传统Office的单一文件版本管理模式。

  3. 一体化内容生产能力:Agnes不仅仅是辅助优化某个环节,而是通过调度多智能体完成专业文档与幻灯片的全流程生成。它是一款从底层以AI架构构建的协作平台,具备完整的一体化内容生产能力。

通过将AI深度嵌入每一步操作,保证实时响应团队讨论,并记忆项目历史、成员反馈和任务目标的能力,动态适应任务的演进,Agnes成为了团队的“协作大脑”,支持长期项目的连贯管理,而不仅仅是局部优化的辅助工具。

NUS博士天团:Multi-Agent协作双引擎

Agnes的核心团队成员主要来自新加坡国立大学与南洋理工大学,创始人Bruce Yang是一位兼具科研深度与产品实战力的“技术派创业者”。Agnes总部位于新加坡,是新加坡本土孵化和培养的AI Agent企业,在底层模型和智能体框架上与NUS校方有深入的合作。

Agnes前端生成与协作体验的优化,根本在于其底层技术架构的突破:团队自主研发的CodeAgents多智能体推理框架以及轻量高效的7B参数推理模型Agnes-R1。这是Agnes最核心的技术护城河,也是它敢于挑战协作办公这一复杂场景的底气所在。

Agnes-R1是Agnes团队自研的7B推理模型,专为团队协作设计。它支持长上下文记忆,能掌握项目前后的关键信息,并与多个Agent协作,处理复杂的多轮推理与资料整合任务。

Agnes在调用模型时,不仅输入用户指令,还注入共享的团队记忆和项目上下文。Agnes-R1会结合任务目标,通过CodeAgents框架自动拆解任务,分配给不同智能体处理,最终汇总输出统一结果。

CodeAgents是Agnes团队自研的多智能体推理框架。根据团队公开发布的论文,CodeAgents在公开基准测试中展现出优异性能,尤其在降低多Agent协作场景下token消耗方面表现突出。

传统多智能体AI框架由于依赖自然语言作为沟通桥梁,较容易陷入token消耗过高、任务流程难以追踪、沟通效率低下、难以复盘与调试等问题中,从而在商业应用中造成对推理成本和可控性的巨大压力。如果应用在协作长流程中,这些问题还会被成倍放大,制约实际落地。

Agnes团队的解决方案是采用结构化伪代码驱动多智能体任务拆解与协作流程,将智能体分工、流程控制、工具调用、异常处理等全部明确写入代码层面,取代传统基于自然语言的松散对话。相当于将多Agent任务处理转化为工业流水线式的运作模式:任务拆解、角色分配、错误处理都有清晰逻辑,在提升性能的同时大幅降低成本。

这个架构可以大致分为三层:

  • 结构化流程管理:对全流程、动作和反馈状态进行结构化管理,精准定位关键失败点和状态变化。
  • 模块化任务拆分:将任务分解为乐高积木式标准化模块,每个模块的目标、分工、工具、反馈均明确细化,组合形成完整的协作任务流。
  • 复杂流程控制能力:支持循环、条件分支、多轮任务自动回滚,以适应复杂工程和多轮协作场景。

根据多项公开基准测试结果,Agnes的CodeAgents框架显著优于传统的自然语言多Agent方法。在GAIA、HotpotQA等多步骤推理和跨工具协作任务中,相比自然语言提示,CodeAgents token成本显著降低,准确率反而更高。在VirtualHome长链路仿真环境下,CodeAgents任务成功率则提升近20%,token消耗减少约四成,大幅降低了成本和算力压力。

更重要的是,这并非是“实验室模型”,而是已接入到真实产品中的成熟能力。这种技术路径不仅意味着更可控的用户体验,也为大规模商业化铺平了道路。在当前大量AI工具因高昂的Token成本而难以盈利的背景下,Agnes的成本与定价优势将成为其在AI协作市场上的关键竞争力。

Agnes优势

Agnes创始人Bruce在新加坡路透社RetuerNext大会上表示,谁能做到便宜、速度快、可控强,谁就能跑得更远。在消费级AI应用中,推理几乎能够占据70–80%的公司年度开销。在保证准确的前提下,AI推理成本优化是下一阶段AI普及的关键。

除了效率与成本的突破,Bruce还在推动AI的“可信任进化”。Agnes团队正在与新加坡国立大学合作,研究一种“AI信任协议机制”,目标是提升AI的透明性和可解释性。核心做法包括:让AI主动回报任务进度和关键里程碑;确保输出是“人类可理解”的语言或结构,以确保人与AI之间的目标和约束达成一致;在训练过程中引入强化学习激励机制,对“未对齐行为”进行惩罚,以提升AI的可信度与协作能力。Bruce表示,他们希望未来能推动一个全球通用的AI信任协议,确保AI始终与人类目标保持一致。

AI办公的下一幕:协作范式的重构

Agnes之所以引人注目,不仅在于其创新性,更因为它站在了协作范式变革的临界点上。AI插件和自动化工具看上去层出不穷,但本质仍是为旧有流程“打蜡抛光”,团队的信息流割裂、知识难以沉淀、跨工具协作低效、流程混乱等问题始终未能根本解决。

Agnes从底层架构、模型训练到Agent框架全部自研,所追求的正是从协作出发,打造AI原生的协作办公系统,重构了内容生成、任务分工与团队记忆的逻辑。让AI不再是辅助工具,而是被嵌入组织运转的主干流程中,推动知识流实现真正的统一和智能分发。

诚然,Agnes在短时间内或许难以撼动微软Office的地位。但它所传递的信号不容忽视:系统级的重构办公,或许才是下一代办公工具的真正起点。未来的“下一代Office”,究竟是更聪明的单兵作战工具,还是更懂协作、流程、记忆的智能“团队大脑”?这场办公领域的革命,值得我们每一个人去关注和深思。