Agnes:新加坡博士团队挑战微软Office,AI重塑团队协作范式

1

在人工智能(AI)浪潮的推动下,办公领域正经历着前所未有的变革。新加坡一支由博士组成的团队,正在挑战微软 Office 的传统地位,他们打造的 AI 办公产品——Agnes,旨在重新定义团队协作和工作效率。本文将深入探讨 Agnes 的创新之处,以及它如何通过技术突破,重塑未来的办公模式。

AI 办公的新挑战

微软 Office Copilot 的发布,无疑是 AI 办公领域的一个重要里程碑。然而,Copilot 更多地扮演着“智能助手”的角色,其功能主要集中在辅助层面。由于软件之间的割裂、缺乏上下文记忆以及协作能力的不足,Copilot 并未从根本上改变办公逻辑。

与此同时,一些 AI 原生平台,如 Manus 和 Genspark,也在尝试提供更轻量级的办公体验,并致力于实现“从写到发”的一体化流程。但这些平台在协作功能和编辑灵活性方面仍有局限性,距离真正提高效率的目标还有一段距离。

面对这些挑战,新加坡的博士团队提出了新的解决方案。他们开发的 AI 协作平台 Agnes,通过系统底层的创新,旨在打破现有的僵局,重塑任务分工和信息流转,从而真正实现 AI 作为团队智能中枢的作用。

Agnes:多智能体驱动的协作 Workspace

与大多数只关注文档本身的 AI 办公工具不同,Agnes 更加注重多人协作的场景。在团队协作中,AI 需要处理的信息量呈指数级增长,包括团队对话、任务、文档和历史决策等。Agnes 通过构建一个具备多人协作能力的原生 AI 办公平台,成功地完成了这一突破。

Agnes 具有以下三大核心特性:

  1. 真正的协作型 AI 工作空间:Agnes 构建了一个深度适配团队协作场景的 AI 工作中台,融合了团队记忆、智能体分工和一体化内容生成。这使得任务推进和信息传递能够围绕实际协作流程展开,而非零散的输入输出。

null

  1. 多人实时协作编辑:Agnes 支持团队成员实时编辑文档、报告和演示内容,所有修改即时可见,提供接近 Google Docs 的流畅协作体验,显著优于传统 Office 的单一文件版本管理模式。

  2. 一体化内容生产能力:Agnes 不仅仅是辅助优化某个环节,而是通过调度多智能体完成专业文档与幻灯片的全流程生成。它是一款从底层以 AI 架构构建的协作平台,具备完整的一体化内容生产能力。

Agnes 通过将 AI 深度嵌入每一步操作,保证实时响应团队讨论,并记忆项目历史、成员反馈和任务目标的能力,动态适应任务的演进,从而成为团队的“协作大脑”,支持长期项目的连贯管理,而不仅仅是局部优化的辅助工具。

NUS 博士天团与 Multi-Agent 协作双引擎

Agnes 核心团队成员主要来自新加坡国立大学与南洋理工大学,创始人兼灵魂人物 Bruce Yang 现为新加坡国立大学在读博士,专注于多 Agent 推理架构与 Agent 应用落地研究。他以第一作者身份发表多篇支撑 Agnes 平台核心能力的技术论文,是一位兼具科研深度与产品实战力的“技术派创业者”。

Agnes 总部位于新加坡,是新加坡本土孵化和培养的 AI Agent 企业,在底层模型和智能体框架上与 NUS 校方有深入的合作。Agnes 在 Product Hunt 等社区平台的用户口碑良好,其产品内容生成速度快、质量高,协作场景切入准确,运营人群精准。

Agnes 前端生成与协作体验的优化,得益于其底层技术架构的突破:团队自主研发的 CodeAgents 多智能体推理框架以及轻量高效的 7B 参数推理模型 Agnes-R1。这是 Agnes 最核心的技术护城河,也是它敢于挑战协作办公这一复杂场景的底气所在。

Agnes-R1 是 Agnes 团队自研的 7B 推理模型,专为团队协作设计。它支持长上下文记忆,能掌握项目前后的关键信息,并与多个 Agent 协作,处理复杂的多轮推理与资料整合任务。

Agnes 在调用模型时,不仅输入用户指令,还注入共享的团队记忆和项目上下文。Agnes-R1 会结合任务目标,通过 CodeAgents 框架自动拆解任务,分配给不同智能体处理,最终汇总输出统一结果。

CodeAgents 则是 Agnes 团队自研的多智能体推理框架。根据团队公开发布的论文,CodeAgents 在公开基准测试中展现出优异性能,尤其在降低多 Agent 协作场景下 token 消耗方面表现突出。

null

传统多智能体 AI 框架由于依赖自然语言作为沟通桥梁,较容易陷入 token 消耗过高、任务流程难以追踪、沟通效率低下、难以复盘与调试等问题中,从而在商业应用中造成对推理成本和可控性的巨大压力。如果应用在协作长流程中,这些问题还会被成倍放大,制约实际落地。

Agnes 团队的解决方案是采用结构化伪代码驱动多智能体任务拆解与协作流程,将智能体分工、流程控制、工具调用、异常处理等全部明确写入代码层面,取代传统基于自然语言的松散对话。这相当于将多 Agent 任务处理转化为工业流水线式的运作模式:任务拆解、角色分配、错误处理都有清晰逻辑,在提升性能的同时大幅降低成本。

这个架构可以大致分为三层:

  1. 结构化流程管理:对全流程、动作和反馈状态进行结构化管理,精准定位关键失败点和状态变化。
  2. 模块化任务拆分:将任务分解为乐高积木式标准化模块,每个模块的目标、分工、工具、反馈均明确细化,组合形成完整的协作任务流。
  3. 复杂流程控制能力:支持循环、条件分支、多轮任务自动回滚,以适应复杂工程和多轮协作场景。

根据多项公开基准测试结果,Agnes 的 CodeAgents 框架显著优于传统的自然语言多 Agent 方法。在 GAIA、HotpotQA 等多步骤推理和跨工具协作任务中,相比自然语言提示,CodeAgents token 成本显著降低,准确率反而更高。在 VirtualHome 长链路仿真环境下,CodeAgents 任务成功率则提升近 20%,token 消耗减少约四成,大幅降低了成本和算力压力。

更重要的是,这并非是“实验室模型”,而是已接入到真实产品中的成熟能力。这种技术路径不仅意味着更可控的用户体验,也为大规模商业化铺平了道路。在当前大量 AI 工具因高昂的 Token 成本而难以盈利的背景下,Agnes 的成本与定价优势将成为其在 AI 协作市场上的关键竞争力。

null

Agnes 创始人 Bruce 在新加坡路透社 RetuerNext 大会上指出,谁能做到便宜、速度快、可控强,谁就能跑得更远。在消费级 AI 应用中,推理几乎能够占据 70–80% 的公司年度开销。在保证准确的前提下,AI 推理成本优化是下一阶段 AI 普及的关键。

除了效率与成本的突破,Bruce 还在推动 AI 的“可信任进化”。Agnes 团队正在与新加坡国立大学合作,研究一种“AI 信任协议机制”,目标是提升 AI 的透明性和可解释性。核心做法包括:让 AI 主动回报任务进度和关键里程碑;确保输出是“人类可理解”的语言或结构,以确保人与 AI 之间的目标和约束达成一致;在训练过程中引入强化学习激励机制,对“未对齐行为”进行惩罚,以提升 AI 的可信度与协作能力。Bruce 表示,他们希望未来能推动一个全球通用的 AI 信任协议,确保 AI 始终与人类目标保持一致。

AI 办公的未来:协作范式的重构

Agnes 的价值在于其创新性,更在于它站在了协作范式变革的临界点上。虽然 AI 插件和自动化工具层出不穷,但本质上仍是为旧有流程“打蜡抛光”,团队的信息流割裂、知识难以沉淀、跨工具协作低效、流程混乱等问题始终未能根本解决。

Agnes 从底层架构、模型训练到 Agent 框架全部自研,其目标是从协作出发,打造 AI 原生的协作办公系统,重构内容生成、任务分工与团队记忆的逻辑。让 AI 不再是辅助工具,而是被嵌入组织运转的主干流程中,推动知识流实现真正的统一和智能分发。

尽管 Agnes 可能无法在短时间内终结微软 Office 的统治,但它提供了一个重要的信号:系统级的重构办公,或许才是下一代办公工具真正的起点。随着其产品功能的完善,未来的 Office 将会朝着哪个方向发展?是更聪明的单兵作战工具,还是懂协作、懂流程、懂记忆的智能“团队大脑”?这场办公革命,值得每一个关注未来工作方式的人深思与期待。尽管工程难度远超传统应用,但如果这条路径能够跑通,其意义将不仅仅是提升某个环节的效率,而是重新定义团队的协作方式。

Agnes 创始人 Bruce 的一句话总结了这场变革的精髓:“赢家会思考如何站在 AI 浪潮中抓住结构性变化、流量入口和组织创新。” Agnes 或许还不够完美,但它已经足够有力、足够新鲜、也足够扎实,值得成为 AI 办公领域的另一个起点。