纳米AI凭什么登顶智能体榜首?深度解析其技术优势与未来潜力
2025年,各界普遍认为是智能体技术迎来爆发式增长的关键节点。第三方机构aicpb发布的最新AI产品榜单,首次纳入了智能体类别,其榜首之争的结果,也引发了业界的广泛关注。
令人颇感意外的是,荣登榜首的并非此前备受瞩目的Manus,亦非搜索引擎巨头百度,或是高调All in AI的字节跳动,而是由360公司孕育的纳米AI。数据显示,纳米AI的月度Web访问量高达156.67M,以断崖式优势领先第二名Manus近10倍,可谓是出乎意料。
值得关注的是,彼时距离纳米AI超级搜索的正式发布尚不足一月。那么,纳米AI超级搜索究竟是如何在短时间内实现异军突起的?其背后又蕴藏着怎样的技术逻辑与战略考量?
智能体时代:AI从“给你答案”到“交付结果”的跃迁
在传统搜索引擎时代,用户获取信息的方式往往是:输入关键词,获得一长串链接,然后手动分析、筛选、整理,且常常难以找到真正符合需求的答案。这种模式的弊端在于,关键词的细微差异可能导致搜索结果大相径庭,搜索引擎难以真正理解用户的意图。此外,竞价排名等商业模式也使得内容质量参差不齐,用户需要花费大量时间过滤无效信息。
ChatGPT的出现,无疑颠覆了传统的信息获取模式。用户可以直接获得一个相对精准的结果,信息获取的方式从“检索、遍历”进化到了“直接获取结果”。
而智能体的出现,则标志着AI生产力落地的又一次范式转移。智能体带来的最大变革,是让AI从“给你答案”变成了“交付结果”。系统不再只是给出一个答案,而是可以自动调用工具执行用户的复杂需求,直接给出一个交付结果。例如,用户输入“优化公司财报”,智能体不再是提供操作指南,而是直接生成一份专业的财报优化方案。
具体而言,一个合格的智能体通常需要具备以下特征:
- 自主性:在最小人工干预下独立运行,具备自我驱动的执行能力。
- 环境感知:通过多种接口实时获取环境状态信息,并理解上下文变化。
- 推理规划:基于目标进行任务分解,制定多步骤执行策略和资源分配方案。
- 适应学习:从执行反馈中提取经验,动态调整行为模式和决策策略。
- 工具集成:主动选择和组合外部工具/API,扩展自身能力边界。
- 状态管理:维护短期工作记忆和长期知识存储,支持上下文连续性。
- 目标导向:围绕明确目标进行行为选择,具备结果评估和纠偏能力。
- 多模态交互:支持自然语言、API 调用等多种交互方式,具备协作能力。
简而言之,真正的智能体应具备“感知→推理→规划→执行→反馈→优化”的完整闭环能力,而不仅仅是高级版本的问答系统。
整体而言,智能体目前仍处于早期阶段。海外市场方面,科技巨头如微软、谷歌、OpenAI 都在积极开发自己的智能体产品。而在国内市场,Manus 和纳米 AI 可以说是最早一批入局的玩家。
场景解析:纳米AI如何实现“所想即所得”?
为了更直观地理解纳米AI智能体的能力,我们不妨选取两个典型的用户场景进行分析。
场景一:一句话生成长视频
用户只需向纳米AI发出指令,例如“生成一条上海城市宣传片”。
面对这一复杂任务,纳米AI会将其拆解为多个环节,包括“输入信息、整理文案、生成分镜脚本、文生图、配音、图生视频、添加配音字幕、视频拼接、获取BGM、添加BGM”等。每个环节由不同的智能体协同完成,最终形成一个多智能体组成的工作流。用户看似只输入了一句话,但支撑纳米AI完成这一复杂需求的,实则是一个智能体团队。
例如,在最开始的信息检索阶段,系统会调用超级搜索智能体,检索出大量相关搜索结果,并以此为基础形成上海城市宣传片的文案和分镜脚本。
以分镜脚本为基础,纳米AI会进一步调用图片生成智能体,生成多个上海的代表性画面作为分镜图片。
值得注意的是,纳米AI最终生成的视频时长可达两分钟,一条视频可能消耗数百万token。以AI生成视频的标准来看,这个长度是相当惊人的。更难能可贵的是,该视频不仅具有连贯的逻辑,还拥有接近摄影实拍的画面质感,配音、BGM、字幕等要素也一应俱全。即使以“人类作者”的标准来衡量,这亦是一个相当成熟的视频作品。
过去,制作一条视频往往需要经过“文案-分镜-拍摄/绘图-剪辑-后期”等繁琐流程,涉及策划、美术师、剪辑师等多个工种的协同配合,耗费数个工作日才能完成。而现在,用户只需花费一杯咖啡的时间,纳米AI就能生成一个成熟的长视频,真正实现了AI生成视频的实用价值。
场景二:处理复杂的研究型问题
以“分析人工智能对就业市场的影响”为例。
令人惊讶的是,在用户输入需求后,纳米AI并没有立即执行任务,而是主动要求进一步明确需求的具体细节。这充分体现了纳米AI的“搜商”,即像人类一样进行思考,主动发起交互、补足思维链。
在生成结果的关键节点,纳米AI也会主动发起询问,以便更好地匹配用户需求。最终生成的报告提纲包含了现状分析、趋势预测、政策建议和结论等,结构完整。
最终,纳米AI超级搜索在十几分钟内生成了一份包含数据图表、趋势分析、政策建议的综合报告。
过去,研究者需要从多个信息源收集资料,然后进行人工分析和整合,往往需要耗费几天甚至几周的时间。而现在,在短短的时间内,任何人都可以快速了解一个复杂问题的基本面貌。
更令人惊喜的是,这份最终生成的报告还可以转换成PDF、Word、思维导图、PPT,甚至是动态网页,形成从资料搜索、生成分析到结果演示的完整闭环。
值得一提的是,纳米AI还在报告末尾列出了详细的参考文献链接。对于复杂的研究型问题而言,这一点至关重要,方便研究者进行进一步的研究和查证。
在整个研究报告的生成过程中,纳米AI自主完成了整个流程,直接交付成果。甚至在用户需求不明确时,它还会主动发起交互,补足思维链。从AI 2.0时代的“告诉你怎么做”,到纳米AI的“直接交付多模态的结果”,这无疑是一整套范式的转变。
实际上,要让AI自主完成一项复杂任务并非易事,其背后是对技术路径的深刻理解和巨大的技术投入。
多模型协作架构是纳米AI最令人印象深刻的技术特点之一。据悉,纳米AI接入了80多个模型,并根据不同的任务需求进行智能调度。正是有了这样的模型基座能力,才能实现复杂任务下的超长思维链。
纳米AI在MCP(Model Context Protocol)工具生态建设上也投入了大量资源,专为国内环境自研了许多MCP。MCP被誉为大模型的USB-C接口。正如USB标准化了硬件接口,MCP也为大模型提供标准化接口,使其能够连接到各种外部数据源和工具,解决了“AI可用”的问题。
目前,纳米AI已接入110+工具,覆盖办公协作、学术研究、生活服务、搜索引擎、金融分析、媒体娱乐、数据抓取等多个领域。在“一句话生成长视频”的应用场景中,文案生成智能体就调用了AI搜索、图片转文字、音视频转文本、AI文档分析等多个MCP工具。
更令人称道的是,纳米AI智能体还实现了对本地浏览器的调用能力,可以识别网页上的所有可点击元素,让大模型像人一样去操作浏览器。
那么,这样做的意义何在?
长期以来,信息孤岛问题一直困扰着搜索引擎。各家互联网公司出于商业考量,并不允许谷歌、百度等搜索引擎抓取信息。但是,有了对浏览器的调用能力之后,智能体就可以像普通用户一样“正常访问”这些平台,获取其内部的深度信息和实时数据。
拥有了这样的能力,纳米AI就可以深度挖掘小红书的旅行攻略和购买建议;直接对比多个电商平台的商品,找到最低价;或是获取社交媒体上的最新趋势和用户反馈。
AI下半场:加速AI效用的生产落地
LnData的报告指出,2024年底全球智能体市场规模已突破500亿美元,年度增长率超过200%。头豹研究院对智能体的增长也持乐观态度。它预测,智能体行业市场规模将从2024年的695.28亿人民币增长至2028年的8520.35亿人民币,年复合增长率高达87.10%。
如此巨大的市场潜力,自然吸引了OpenAI、谷歌、微软等科技巨头,以及字节跳动、阿里、腾讯、百度等国内大厂的全面加码。
就在7月17日深夜,OpenAI正式发布了ChatGPT Agent,这个被业界期待已久的智能体终于姗姗来迟。然而,与ChatGPT初次发布时的惊艳不同,舆论对ChatGPT Agent的评价呈现出两极分化的态势。
支持者认为,这标志着AI从“对话式AI”向“任务执行型AI”的转变。
反对者则认为,ChatGPT Agent的发布更像是一次“补课”而非“创新”,因为它所展示的核心能力,例如多步骤任务规划、工具调用、上下文记忆等,在国内早已不是什么新鲜事——Manus和纳米AI早在几个月前就已经实现了类似的功能。在某些方面,例如可视化生成,纳米AI甚至展现出了比ChatGPT Agent更好的能力。
整体而言,ChatGPT Agent并没有表现出超越国内智能体的能力。这其实反映了一个更深层的问题:AI领域的技术护城河正在快速缩小。OpenAI的生态整合能力和产品化水平依然值得学习,但纯粹从智能体能力来看,国内外的差距确实在快速缩小,某些细分领域甚至已经出现了反超。
智能体的终局尚未可知,但是在特定领域逐步发挥作用、成为提升工作效率的重要工具,的确是一条可预见的迭代路径。真正的挑战在于如何找到合适的应用场景,构建可持续的商业模式,并在技术创新和用户需求之间找到平衡点。毕竟,技术再牛,用户不买单也是白搭。
在AI下半场的激烈竞争中,纳米AI走出了一条独特的差异化路线——它没有选择与巨头们正面硬刚通用型超级智能体,而是选择成为智能体生态繁荣的基础设施搭建者。
周鸿祎对纳米AI的愿景很明确——将纳米AI打造成最大的“智能体社区”。
从数量上看,纳米AI目前已经拥有近万个专业智能体,覆盖不同行业和场景的业务需求。用户面对具体问题时,只需输入需求描述,平台即可匹配对应的专业智能体,实现从需求到解决方案的快速连接。
平台的价值不仅在于丰富的智能体资源,更在于其灵活的组合能力。在纳米AI,如果你的任务需求过于复杂,用户还可以调用多个智能体、组建多个智能体协作的团队,通过任务分解和流程优化,实现更高效的问题解决。这种团队化协作模式,为个人和小团队提供了以往只有大企业才能享有的专业服务能力。
如果多智能体协作还不能解决你的问题,纳米AI的“360智能体工厂”,还提供了低门槛的智能体搭建平台。通过自然语言交互,用户无需编程技能即可创建符合特定需求的智能体。这种零代码创建方式,让智能体的定制化变得简单高效,真正实现了“人人都能造专家”的愿景。
周鸿祎表示,AI时代为每个人、每个组织都带来了前所未有的机遇,每个人都可以拥有三五十个智能体,形成自己的专家队伍,这些智能体听你指挥,替你干活,每个人都有机会成为超级个体。
AI下半场,叙事逻辑从技术炫技逐步走向“效用落地”,从追求技术先进性转向追求解决问题的有效性,这才是AI的价值回归,真正变成普通人的生产力工具。
纳米AI在榜单上的排名可以视作是一个阶段性的成果。断层领先第二名近10倍,这并非偶然,背后反映的是使用智能体这一产品形态的强烈市场需求。
当所有人都在谈论AGI的终极目标时,纳米AI已经在实际应用中交出了答案:AI的价值不在于有多“智能”,而在于能为多少人解决多少问题。
可以预见,智能体这场战役并不好打,但纳米AI已经早早入局,并握了一副好牌。