Agnes：新加坡博士团队如何用AI协作平台挑战微软Office？

在人工智能（AI）技术日新月异的今天，AI不再仅仅是工具，而正在演变为团队中真正的“智能中枢”。这一理念正在被越来越多的创新者所接受，并积极地将其融入到新一代的办公产品设计中。

微软于2023年3月推出了Office Copilot，这被视为AI办公革命的开端。然而，早期的尝试主要集中在提供简单的“智能助手”或“聊天工具栏”等辅助功能上。由于软件之间的割裂、缺乏对上下文的记忆以及协作能力的不足，这些Copilot式的插件并没有从根本上改变办公的逻辑。

与此同时，像Manus和Genspark这样的AI原生平台，虽然致力于提供更轻量级的办公体验，并尝试实现从内容创作到发布的一体化流程，但在协作功能和编辑灵活性方面仍存在局限性，距离真正实现效率的质变还有一段距离。这些平台在处理复杂的团队协作和需要高度定制化的内容创作时，往往显得力不从心。

面对这些挑战，一个由新加坡博士团队组成的创新团队提出了全新的解决方案，旨在打破AI办公领域的现有僵局。他们开发的AI协作平台Agnes，通过对系统底层的创新，重塑了任务分工和信息流转的方式，有效地消除了工具之间的壁垒和信息孤岛，使AI真正成为团队的智能中枢，从而能够更好地应对复杂的任务流程和实际的业务需求。

null

多智能体驱动的全新协作工作空间

当前，大多数AI办公工具主要关注文档本身，侧重于单人任务的处理。然而，一旦涉及到需要多轮次、跨成员参与的复杂团队协作，这些工具往往显得力不从心。这是因为在单人任务中，AI只需要理解单个用户的上下文信息。而在团队协作场景下，AI需要处理的信息包括整个团队的对话记录、任务分配、文档资料以及历史决策等，信息量呈现指数级增长。

这种对超长上下文的理解、复杂工具的调用以及版本控制与冲突解决等挑战，都使得AI融入协作流程变得异常困难。Agnes正是在这样的背景下，罕见地完成了这一突破，构建了一个具备多人协作能力的AI原生办公平台。该平台可以用于撰写文章、制作研究报告和演示文稿等多种办公任务。

通过Agnes，团队成员无需在多个应用和界面之间频繁切换，所有的输入输出、协作过程和任务进展都集中在一个具备记忆能力的统一工作空间中。Agnes的三大核心特性包括：

真正的协作型AI工作空间：Agnes构建了一个深度适配团队协作场景的AI工作平台，融合了团队记忆、智能体分工和一体化内容生成。这使得任务推进和信息传递能够围绕实际的协作流程展开，而不是零散的输入输出。
多人实时协作编辑：Agnes支持团队成员实时编辑文档、报告和演示文稿等内容，所有的修改都能即时可见，提供接近Google Docs的流畅协作体验，显著优于传统Office的单一文件版本管理模式。
一体化内容生产能力：Agnes不仅仅是辅助优化某个环节，而是通过调度多个智能体来完成专业文档和幻灯片的全流程生成。它是一款从底层以AI架构构建的协作平台，具备完整的一体化内容生产能力。

通过将AI深度嵌入到每一步操作中，Agnes能够实时响应团队讨论，记忆项目历史、成员反馈和任务目标，并动态适应任务的演进。这使得Agnes成为了团队的“协作大脑”，支持长期项目的连贯管理，而不仅仅是局部优化的辅助工具。

NUS博士天团：Multi-Agent协作双引擎

Agnes的核心团队主要由来自新加坡国立大学（NUS）和南洋理工大学（NTU）的博士组成。创始人兼核心人物Bruce Yang目前是新加坡国立大学的在读博士，专注于多Agent推理架构与Agent应用落地研究。他已经以第一作者的身份发表了多篇支撑Agnes平台核心能力的技术论文，是一位兼具科研深度与产品实战能力的“技术派创业者”。

Bruce本科毕业于加州大学伯克利分校，师从图灵奖得主，主修数学与计算机双学位。毕业后，他曾在微软和领英担任工程管理职位，主导会员付费等项目。Agnes总部位于新加坡，是新加坡本土孵化和培养的AI Agent企业，在底层模型和智能体框架上与NUS校方有着深入的合作。从Agnes产品在Product Hunt等社区平台的用户评论来看，其口碑良好。

null

一方面，Agnes产品本身的内容生成速度和质量在同类产品中处于领先地位，其协作场景的切入点也非常准确。另一方面，Agnes的运营人群精准，主要服务于白领、学生和内容创作者。新加坡人才活跃，Agnes与早期用户建立了稳固的连接，甚至有本地媒体称其为新加坡的“DeepSeek”。

Agnes前端生成与协作体验的优化，根本在于其底层技术架构的突破：团队自主研发的CodeAgents多智能体推理框架以及轻量高效的7B参数推理模型Agnes-R1。这是Agnes最核心的技术壁垒，也是其敢于挑战协作办公这一复杂场景的底气所在。

Agnes-R1是Agnes团队自研的7B推理模型，专为团队协作设计。它支持长上下文记忆，能够掌握项目前后的关键信息，并与多个Agent协作，处理复杂的多轮推理与资料整合任务。如图所示，Agnes在调用模型时，不仅输入用户指令，还注入共享的团队记忆和项目上下文。Agnes-R1会结合任务目标，通过CodeAgents框架自动拆解任务，分配给不同的智能体处理，最终汇总输出统一结果。

CodeAgents则是Agnes团队自研的多智能体推理框架。根据团队公开发布的论文，CodeAgents在公开基准测试中展现出优异的性能，尤其是在降低多Agent协作场景下token消耗方面表现突出。

null

传统的多智能体AI框架由于依赖自然语言作为沟通桥梁，较容易陷入token消耗过高、任务流程难以追踪、沟通效率低下以及难以复盘与调试等问题中，从而在商业应用中造成对推理成本和可控性的巨大压力。如果应用在协作长流程中，这些问题还会被成倍放大，制约实际落地。

Agnes团队的解决方案是采用结构化伪代码驱动多智能体任务拆解与协作流程，将智能体分工、流程控制、工具调用和异常处理等全部明确写入代码层面，取代传统基于自然语言的松散对话。这相当于将多Agent任务处理转化为工业流水线式的运作模式：任务拆解、角色分配和错误处理都有清晰的逻辑，在提升性能的同时大幅降低成本。

这个架构可以大致分为三层：

结构化流程管理：对全流程、动作和反馈状态进行结构化管理，精准定位关键失败点和状态变化。
模块化任务拆分：将任务分解为乐高积木式标准化模块，每个模块的目标、分工、工具和反馈均明确细化，组合形成完整的协作任务流。
复杂流程控制能力：支持循环、条件分支和多轮任务自动回滚，以适应复杂工程和多轮协作场景。

根据多项公开基准测试结果，Agnes的CodeAgents框架显著优于传统的自然语言多Agent方法。在GAIA、HotpotQA等多步骤推理和跨工具协作任务中，相比自然语言提示，CodeAgents的token成本显著降低，准确率反而更高。在VirtualHome长链路仿真环境下，CodeAgents的任务成功率提升近20%，token消耗减少约四成，大幅降低了成本和算力压力。

更重要的是，这并非是“实验室模型”，而是已经接入到真实产品中的成熟能力。这种技术路径不仅意味着更可控的用户体验，也为大规模商业化铺平了道路。在当前大量AI工具因高昂的Token成本而难以盈利的背景下，Agnes的成本与定价优势将成为其在AI协作市场上的关键竞争力。

null

创始人Bruce不久前在新加坡路透社RetuerNext大会上也提到了这个问题。他认为，谁能做到便宜、速度快、可控性强，谁就能跑得更远。在消费级AI应用中，推理几乎能够占据公司年度开销的70-80%。在保证准确的前提下，AI推理成本优化是下一阶段AI普及的关键。

除了效率与成本的突破，Bruce还在推动AI的“可信任进化”。Agnes团队正在与新加坡国立大学合作，研究一种“AI信任协议机制”，目标是提升AI的透明性和可解释性。核心做法包括：让AI主动汇报任务进度和关键里程碑；确保输出是“人类可理解”的语言或结构，以确保人与AI之间的目标和约束达成一致；在训练过程中引入强化学习激励机制，对“未对齐行为”进行惩罚，以提升AI的可信度与协作能力。Bruce表示，他们希望未来能够推动一个全球通用的AI信任协议，确保AI始终与人类目标保持一致。

AI办公的下一幕：协作范式的重构

Agnes之所以引人注目，不仅在于其创新性，更在于它站在了协作范式变革的临界点上。AI插件和自动化工具层出不穷，但本质上仍是为旧有流程“打蜡抛光”，团队的信息流割裂、知识难以沉淀、跨工具协作低效和流程混乱等问题始终未能得到根本解决。

Agnes从底层架构、模型训练到Agent框架全部自研，所追求的正是从协作出发，打造AI原生的协作办公系统，重构内容生成、任务分工与团队记忆的逻辑。这使得AI不再是辅助工具，而是被嵌入到组织运转的主干流程中，推动知识流实现真正的统一和智能分发。

虽然Agnes在短时间内可能无法像其声称的那样终结微软Office的统治，但它提供了一个重要的信号：系统级的重构办公，或许才是下一代办公工具真正的起点。随着其产品功能的完善，“下一代Office”是更聪明的单兵作战工具，还是懂得协作、流程和记忆的智能“团队大脑”？这场办公革命，值得每一个关注未来工作方式的人深入思考与期待。尽管工程难度远超传统应用，但如果这条路径能够跑通，其意义将不仅仅是提升某个环节的效率，而是重新定义团队的协作方式。

最后，以Agnes创始人Bruce的一句话结尾：“赢家会思考如何站在AI浪潮中抓住结构性变化、流量入口和组织创新。”Agnes可能不够完美，但它已经足够有力、足够新鲜，也足够扎实，值得成为AI办公领域的另一个起点。