Agnes:新加坡博士团队的AI协作平台,能否重塑办公范式?

1

在人工智能(AI)技术浪潮的推动下,办公领域正经历着前所未有的变革。新加坡一支由博士组成的团队,推出了一款名为Agnes的AI办公产品,旨在挑战微软Office在办公软件领域的地位。这款产品并非仅仅是一个工具,而是致力于成为团队的“智能中枢”,从而实现更高效的协作和信息管理。

当前,微软Office Copilot等AI办公工具主要停留在“智能助手”的辅助层面,它们在软件的互联互通、上下文记忆以及协作能力方面存在局限性,难以从根本上改变办公模式。而Manus和Genspark等新兴的AI原生平台,虽然力图提供更轻量级的办公体验,并实现从内容创作到发布的闭环,但其协作功能相对薄弱,编辑灵活性不足,距离真正提升效率仍有差距。

null

面对这些挑战,Agnes团队提出了全新的解决方案。他们通过对系统底层的创新,重塑了任务分配和信息流动的方式,有效地连接了不同的工具和信息,使AI能够真正成为团队的智能中心,从而应对复杂的任务流程和实际的业务需求。Agnes的出现,为AI办公领域带来了新的可能性。

多智能体驱动的协作新模式

现有的AI办公工具大多专注于文档处理和个人任务,但在涉及多方参与的复杂团队协作时,往往显得力不从心。这是因为在团队协作中,AI需要处理的信息量呈指数级增长,包括团队对话、任务、文档以及历史决策等。超长的上下文理解、复杂的工具调用、版本控制以及冲突解决等问题,使得AI难以融入协作流程。

Agnes在这方面取得了显著突破,它构建了一个具备多人协作能力的原生AI办公平台,可以用于撰写文章、研究报告、制作PPT等多种办公任务。团队成员无需在多个应用和界面之间切换,所有的输入输出、协作以及任务进展都集中在一个统一的工作空间中,且具备记忆能力。

null

Agnes的核心特性主要体现在以下几个方面:

  • 真正的协作型AI工作空间:Agnes构建了一个深度适配团队协作场景的AI工作平台,融合了团队记忆、智能体分工和一体化内容生成等功能。这使得任务推进和信息传递能够围绕实际协作流程展开,而不是零散的输入输出。
  • 多人实时协作编辑:Agnes支持团队成员实时编辑文档、报告和演示内容,所有的修改可以即时看到,提供接近Google Docs的流畅协作体验,优于传统Office的单一文件版本管理模式。
  • 一体化内容生产能力:Agnes不仅仅是辅助优化某个环节,而是通过调度多智能体完成专业文档和幻灯片的全流程生成。它是一款从底层以AI架构构建的协作平台,具备完整的一体化内容生产能力。

Agnes通过将AI深度嵌入到每一个操作步骤中,保证了对团队讨论的实时响应,并具备记忆项目历史、成员反馈和任务目标的能力,从而能够动态地适应任务的演进。这使得Agnes成为了团队的“协作大脑”,支持长期项目的连贯管理,而不仅仅是局部优化的辅助工具。

NUS博士团队的技术引擎

Agnes的核心团队成员主要来自新加坡国立大学(NUS)和南洋理工大学(NTU),创始人兼核心人物Bruce Yang是新加坡国立大学的在读博士,专注于多Agent推理架构和Agent应用落地研究。他以第一作者的身份发表了多篇支撑Agnes平台核心能力的技术论文,是一位兼具科研深度和产品实战能力的“技术派创业者”。Bruce本科毕业于加州大学伯克利分校,师从图灵奖得主,主修数学与计算机双学位,曾在微软和领英担任工程管理职位,主导会员付费等项目。

Agnes总部位于新加坡,是一家在新加坡本土孵化和培养的AI Agent企业,在底层模型和智能体框架上与NUS有深入的合作。从Agnes产品在Product Hunt等社区平台的用户评论来看,其口碑良好。一方面,产品本身的内容生成速度和质量在同类产品中属于佼佼者,协作场景的切入点精准;另一方面,运营人群精准,主要服务于白领、学生和内容创作者。新加坡人才活跃,与早期用户建立了稳固的连接,甚至有本地媒体称其为新加坡的“DeepSeek”。

Agnes前端生成与协作体验的优化,根本在于其底层技术架构的突破:团队自主研发的CodeAgents多智能体推理框架以及轻量高效的7B参数推理模型Agnes-R1。这是Agnes最核心的技术壁垒,也是其敢于挑战协作办公这一复杂场景的底气所在。

Agnes-R1是Agnes团队自研的7B推理模型,专为团队协作设计。它支持长上下文记忆,能够掌握项目前后的关键信息,并与多个Agent协作,处理复杂的多轮推理与资料整合任务。

null

如图所示,Agnes在调用模型时,不仅输入用户指令,还注入共享的团队记忆和项目上下文。Agnes-R1会结合任务目标,通过CodeAgents框架自动拆解任务,分配给不同的智能体处理,最终汇总输出统一结果。

CodeAgents是Agnes团队自研的多智能体推理框架。根据团队公开发布的论文,CodeAgents在公开基准测试中展现出优异的性能,尤其在降低多Agent协作场景下token消耗方面表现突出。

传统的多智能体AI框架由于依赖自然语言作为沟通桥梁,容易陷入token消耗过高、任务流程难以追踪、沟通效率低下以及难以复盘和调试等问题中,从而在商业应用中造成对推理成本和可控性的巨大压力。如果应用在协作长流程中,这些问题还会被成倍放大,制约实际落地。

Agnes团队的解决方案是采用结构化伪代码驱动多智能体任务拆解与协作流程,将智能体分工、流程控制、工具调用以及异常处理等全部明确写入代码层面,取代传统基于自然语言的松散对话。这相当于将多Agent任务处理转化为工业流水线式的运作模式:任务拆解、角色分配、错误处理都有清晰的逻辑,在提升性能的同时大幅降低成本。

null

这个架构可以大致分为三层:

  • 结构化流程管理:对全流程、动作和反馈状态进行结构化管理,精准定位关键失败点和状态变化。
  • 模块化任务拆分:将任务分解为乐高积木式标准化模块,每个模块的目标、分工、工具和反馈均明确细化,组合形成完整的协作任务流。
  • 复杂流程控制能力:支持循环、条件分支以及多轮任务自动回滚,以适应复杂的工程和多轮协作场景。

根据多项公开基准测试结果,Agnes的CodeAgents框架显著优于传统的自然语言多Agent方法。在GAIA、HotpotQA等多步骤推理和跨工具协作任务中,相比自然语言提示,CodeAgents的token成本显著降低,准确率反而更高。在VirtualHome长链路仿真环境下,CodeAgents的任务成功率提升近20%,token消耗减少约四成,大幅降低了成本和算力压力。

更重要的是,这并非是“实验室模型”,而是已接入到真实产品中的成熟能力。这种技术路径不仅意味着更可控的用户体验,也为大规模商业化铺平了道路。在当前大量AI工具因高昂的Token成本而难以盈利的背景下,Agnes的成本与定价优势将成为其在AI协作市场上的关键竞争力。

null

Agnes创始人Bruce Yang在新加坡路透社RetuerNext大会上表示,谁能做到便宜、速度快、可控性强,谁就能走得更远。在消费级AI应用中,推理几乎能够占据公司年度开销的70-80%。在保证准确的前提下,AI推理成本优化是下一阶段AI普及的关键。

除了效率与成本的突破,Bruce还在推动AI的“可信任进化”。Agnes团队正在与新加坡国立大学合作,研究一种“AI信任协议机制”,目标是提升AI的透明性和可解释性。核心做法包括:让AI主动汇报任务进度和关键里程碑;确保输出是“人类可理解”的语言或结构,以确保人与AI之间的目标和约束达成一致;在训练过程中引入强化学习激励机制,对“未对齐行为”进行惩罚,以提升AI的可信度与协作能力。Bruce表示,他们希望未来能推动一个全球通用的AI信任协议,确保AI始终与人类目标保持一致。

AI办公的未来:协作范式的重构

Agnes之所以备受关注,不仅在于其创新性,更在于它站在了协作范式变革的临界点上。尽管AI插件和自动化工具层出不穷,但本质上仍是在为旧有的流程“打蜡抛光”,团队的信息流割裂、知识难以沉淀、跨工具协作低效、流程混乱等问题始终未能得到根本解决。

Agnes从底层架构、模型训练到Agent框架全部自研,其目标是从协作出发,打造AI原生的协作办公系统,重构内容生成、任务分配与团队记忆的逻辑。这使得AI不再是辅助工具,而是嵌入到组织运转的主干流程中,推动知识流实现真正的统一和智能分发。

虽然Agnes在短期内可能无法像其声称的那样终结微软Office的统治,但它提供了一个重要的信号:系统级的重构办公,或许才是下一代办公工具真正的起点。随着其产品功能的完善,“下一代Office”是更聪明的单兵作战工具,还是懂协作、懂流程、懂记忆的智能“团队大脑”?这场办公革命,值得每一个关注未来工作方式的人深思与期待。尽管工程难度远超传统应用,但如果这条路径能够走通,其意义将不仅仅是提升某个环节的效率,而是重新定义团队的协作方式。

Agnes创始人Bruce Yang曾说过:“赢家会思考如何站在AI浪潮中抓住结构性变化、流量入口和组织创新。”或许Agnes还不够完美,但它已经足够有力、足够新鲜、也足够扎实,值得成为AI办公领域的另一个起点。