Agnes:新加坡AI团队挑战微软Office,重塑团队协作新范式

1

在人工智能(AI)技术日新月异的今天,办公软件领域正迎来一场前所未有的变革。微软Office Copilot的发布,无疑是这场变革的开端,但其仅仅停留在“智能助手”的辅助层面,未能从根本上解决办公协作的痛点。与此同时,一些新兴的AI原生平台,如Manus和Genspark,虽然致力于提供更轻量级的办公体验,但同样面临着协作功能薄弱、编辑灵活性不足等问题。

在此背景下,一支由新加坡博士团队打造的AI协作平台——Agnes,正试图打破这一僵局。Agnes通过系统底层的创新,重塑了任务分工和信息流转,有效打通了工具壁垒和信息孤岛,让AI真正成为团队的智能中枢,从而能够应对复杂任务流和真实业务需求。

多智能体驱动的全新协作工作空间

传统AI办公工具往往只关注文档本身,侧重于单人任务的处理。然而,在涉及多轮次、跨成员的复杂团队协作时,这些工具往往显得力不从心。这是因为在团队协作场景下,AI需要处理的信息量呈指数级增长,包括整个团队的对话、任务、文档以及历史决策。超长的上下文理解、复杂的工具调用以及版本控制与冲突解决的挑战,都使得AI融入协作流程成为一个难题。

Agnes率先完成了这一突破,构建了一个具备多人协作能力的AI原生办公平台,可以完成撰写文章、研究报告、制作PPT等基础办公任务。团队成员无需在多个应用和界面之间频繁切换,所有输入输出、协作与任务进展都集中在一个具备记忆能力的统一工作空间中。

多人协作

Agnes的核心特性主要体现在以下三个方面:

  • 真正的协作型AI工作空间:Agnes构建了一个深度适配团队协作场景的AI工作平台,融合了团队记忆、智能体分工和一体化内容生成。这使得任务推进和信息传递能够围绕实际协作流程展开,而非零散的输入输出。
  • 多人实时协作编辑:Agnes支持团队成员实时编辑文档、报告和演示内容,所有修改即时可见,提供接近Google Docs的流畅协作体验,优于传统Office的单一文件版本管理模式。
  • 一体化内容生产能力:Agnes不仅仅是辅助优化某个环节,而是通过调度多智能体完成专业文档与幻灯片的全流程生成。它是一款从底层以AI架构构建的协作平台,具备完整的一体化内容生产能力。

通过将AI深度嵌入每一步操作,保证实时响应团队讨论,并记忆项目历史、成员反馈和任务目标的能力,动态适应任务的演进,Agnes成为了团队的“协作大脑”,支持长期项目的连贯管理,而不仅仅是局部优化的辅助工具。

NUS博士天团:Multi-Agent协作双引擎

Agnes的核心团队成员主要来自新加坡国立大学(NUS)与南洋理工大学(NTU)的博士。创始人兼灵魂人物Bruce Yang,现为新加坡国立大学在读博士,专注于多Agent推理架构与Agent应用落地研究。他以第一作者身份发表多篇支撑Agnes平台核心能力的技术论文,是一位兼具科研深度与产品实战力的“技术派创业者”。Bruce本科毕业于加州大学伯克利分校,师从图灵奖得主,主修数学与计算机双学位。毕业后,他曾在微软和领英担任工程管理,主导会员付费等项目。

Agnes总部位于新加坡,是新加坡本土孵化和培养的AI Agent企业,在底层模型和智能体框架上与NUS校方有深入的合作。从Agnes产品在Product Hunt等社区平台的用户评论来看,其口碑良好。

一方面,Agnes的内容生成速度和质量在同类产品中处于领先地位,协作场景的切入点准确。另一方面,Agnes运营人群精准,主要服务于白领、学生与内容创作者。凭借新加坡人才的活跃,Agnes与早期用户建立了稳固的连接,甚至有本地媒体称其为新加坡的“DeepSeek”。

Agnes前端生成与协作体验的优化,得益于其底层技术架构的突破:团队自主研发的CodeAgents多智能体推理框架以及轻量高效的7B参数推理模型Agnes-R1。这是Agnes最核心的技术护城河,也是其敢于挑战协作办公这一复杂场景的底气所在。

Agnes-R1是Agnes团队自研的7B推理模型,专为团队协作设计。它支持长上下文记忆,能够掌握项目前后的关键信息,并与多个Agent协作,处理复杂的多轮推理与资料整合任务。

如图所示,Agnes在调用模型时,不仅输入用户指令,还注入共享的团队记忆和项目上下文。Agnes-R1会结合任务目标,通过CodeAgents框架自动拆解任务,分配给不同智能体处理,最终汇总输出统一结果。

CodeAgents则是Agnes团队自研的多智能体推理框架。根据团队公开发布的论文,CodeAgents在公开基准测试中展现出优异性能,尤其在降低多Agent协作场景下token消耗方面表现突出。

CodeAgents框架

传统多智能体AI框架由于依赖自然语言作为沟通桥梁,容易陷入token消耗过高、任务流程难以追踪、沟通效率低下、难以复盘与调试等问题中,从而在商业应用中造成对推理成本和可控性的巨大压力。如果应用在协作长流程中,这些问题还会被成倍放大,制约实际落地。

Agnes团队的解决方案是采用结构化伪代码驱动多智能体任务拆解与协作流程,将智能体分工、流程控制、工具调用、异常处理等全部明确写入代码层面,取代传统基于自然语言的松散对话。这相当于将多Agent任务处理转化为工业流水线式的运作模式:任务拆解、角色分配、错误处理都有清晰逻辑,在提升性能的同时大幅降低成本。

这个架构可以大致分为三层:

  1. 结构化流程管理:对全流程、动作和反馈状态进行结构化管理,精准定位关键失败点和状态变化。
  2. 模块化任务拆分:将任务分解为乐高积木式标准化模块,每个模块的目标、分工、工具、反馈均明确细化,组合形成完整的协作任务流。
  3. 复杂流程控制能力:支持循环、条件分支、多轮任务自动回滚,以适应复杂工程和多轮协作场景。

根据多项公开基准测试结果,Agnes的CodeAgents框架显著优于传统的自然语言多Agent方法。在GAIA、HotpotQA等多步骤推理和跨工具协作任务中,相比自然语言提示,CodeAgents token成本显著降低,准确率反而更高。在VirtualHome长链路仿真环境下,CodeAgents任务成功率则提升近20%,token消耗减少约四成,大幅降低了成本和算力压力。

更重要的是,这并非是“实验室模型”,而是已接入到真实产品中的成熟能力。这种技术路径不仅意味着更可控的用户体验,也为大规模商业化铺平了道路。在当前大量AI工具因高昂的Token成本而难以盈利的背景下,Agnes的成本与定价优势将成为其在AI协作市场上的关键竞争力。

Agnes创始人Bruce曾在新加坡路透社RetuerNext大会上表示,谁能做到便宜、速度快、可控强,谁就能跑得更远。在消费级AI应用中,推理几乎能够占据70–80%的公司年度开销。在保证准确的前提下,AI推理成本优化是下一阶段AI普及的关键。

除了效率与成本的突破,Bruce还在推动AI的“可信任进化”。Agnes团队正在与新加坡国立大学合作,研究一种“AI信任协议机制”,目标是提升AI的透明性和可解释性。核心做法包括:让AI主动回报任务进度和关键里程碑;确保输出是“人类可理解”的语言或结构,以确保人与AI之间的目标和约束达成一致;在训练过程中引入强化学习激励机制,对“未对齐行为”进行惩罚,以提升AI的可信度与协作能力。Bruce表示,他们希望未来能推动一个全球通用的AI信任协议,确保AI始终与人类目标保持一致。

AI办公的下一幕:协作范式的重构

Agnes之所以引人注目,不仅在于其创新性,更因为它站在了协作范式变革的临界点上。AI插件和自动化工具层出不穷,但本质仍是为旧有流程“打蜡抛光”,团队的信息流割裂、知识难以沉淀、跨工具协作低效、流程混乱等问题始终未能根本解决。

Agnes从底层架构、模型训练到Agent框架全部自研,所追求的正是从协作出发,打造AI原生的协作办公系统,重构了内容生成、任务分工与团队记忆的逻辑。让AI不再是辅助工具,而是被嵌入组织运转的主干流程中,推动知识流实现真正的统一和智能分发。

在短时间内,Agnes或许无法终结微软Office的统治,但它提供了一个重要的信号:系统级的重构办公,或许才是下一代办公工具真正的起点。随着其产品功能的完善,“下一代Office”是更聪明的单兵作战工具,还是懂协作、懂流程、懂记忆的智能“团队大脑”?这场办公革命,值得每一个关注未来工作方式的人深思与期待。尽管工程难度远超传统应用,但如果这条路径能够跑通,其意义将不仅仅是提升某个环节的效率,而是重新定义团队的协作方式。

正如Agnes创始人Bruce所说:“赢家会思考如何站在AI浪潮中抓住结构性变化、流量入口和组织创新。”Agnes值得成为AI办公领域的另一个起点。