模型能力的提升似乎暂时趋于平稳,当前的市场竞争焦点已逐渐从单纯的技术指标比拼转向实际场景的应用落地。
GPT-5的发布可视为一个分水岭。虽然经过长时间的开发,GPT-5并未展现出与GPT-4在本质上的巨大差异,甚至因模型预设人格问题引发了一些用户的反感情绪。这基本宣告了一个事实:过去两年,大模型的能力跃进并未实现颠覆性突破。各家模型即使在跑分榜上存在差距,这种差距也难以直接转化为用户可感知的价值。因此,单纯追求模型参数与能力的“军备竞赛”已不再是唯一的战场。
站在这样一个时间节点,当模型能力日益同质化,所有AI公司都以“一句话生成xxx”作为标准宣传语时,真正的差异化竞争在于如何将技术有效落地,为用户创造真实价值。带着这样的观察视角,我们深入体验了MiniMax Agent。

社区化创新:Gallery 与 Remix机制
大多数Agent产品都面临一个共同的用户体验挑战——一个空白的输入框,背后却是无限的可能性。对于缺乏经验的创作者而言,这无疑是一块令人望而生畏的“空白画布”。正如苹果公司创始人史蒂夫·乔布斯曾言,用户常常不知道自己想要什么,直到你将成品摆在他们面前。
MiniMax Agent通过一个类似“应用商店”的Gallery(作品廊)区域,有效解决了这一问题。作品廊中既有“交互式统计学教程”这类教育应用,也有“横版冒险游戏”这样的轻娱乐,以及“全球演唱会指南”等实用信息工具。这种设计,实际上将用户的思考从“我该怎么做?”自然地引导向了“我能做什么?”

在输入框下方,MiniMax的Gallery区域展示了其他用户已经完成的作品,这为新用户提供了丰富的灵感。
不仅如此,MiniMax还创新性地引入了“Remix”机制。如果你对某个作品感兴趣,可以支付100积分对其进行修改,使其成为你独有的版本。而这100积分,将作为一种激励全部返还给原作者。这是一个三方共赢的策略:
- 新用户能够以较小的成本获得一个相对确定的产出。
- 老用户可以通过作品获得相应激励。
- 对于MiniMax而言,这不仅促进了创作者生态的繁荣,更实际的是,系统整体的算力消耗也因此减少。
我们从Gallery中选择了一个“OpenAI新闻网页”案例。其原始需求明确:“利用Serper API每分钟更新OpenAI新闻,UI贴近OpenAI官网的油画质感”。基于此基础,我们提出了定制需求:“除了OpenAI,还要获取谷歌、Anthropic、微软、Meta的AI新闻,UI风格改为苹果官网的简洁风格”。
随后,Agent给出了清晰的升级计划:自动分解任务、制定执行步骤,并在获得用户同意后开始执行,还会主动询问“是否符合预期”——整个过程无需自己编写一行代码,只需确认需求即可。在开发过程中,Agent还主动请求了所需的API权限(Serper API用于搜索新闻,Supabase用于存储数据),这意味着它具备了处理数据存储和管理的全栈开发能力,而不仅仅是一个“前端皮肤”生成器。
经过十几分钟的开发周期,一个定制化的新闻聚合器就基本完成了。不过初始版本仅成功获取了Anthropic的新闻,其他公司的新闻则出现缺失。幸运的是,Agent很快识别出问题,并又花费十几分钟进行迭代修复。最终成品不仅能按公司筛选新闻(例如只查看微软AI动态),还能手动搜索关键词,并实现每分钟自动更新。
值得注意的是,在Agent的协助下,如果后续有迭代需求(如添加更多订阅源、更换UI风格等),都能快速完成。同时,所有工程文件都经过规范化整理打包,为有经验的开发者提供了精细化手动修改的空间。对于MiniMax VIP用户,平台还提供了个性化域名服务。完成作品后,用户可以直接发布,投入使用。这意味着,从开发、测试、部署到发布,MiniMax提供了一个完整的产品交付闭环,这与早期仅提供静态网页式Agent产品有着本质区别。
复杂场景应用:创意美食App的探索
为了进一步测试MiniMax的能力边界,我们设计了一个更具挑战性的任务:开发一个基于AI的美食探索App。但其核心功能并非推荐餐厅或菜谱,而是通过分析用户的感官描述和偏好,反向推导出他们可能喜欢的特定美食或饮品。例如,用户不再输入“上海小笼包”或“日式拉面”,而是输入一系列感官关键词,比如:“有嚼劲的”、“微辣的”、“带有烟熏味的”,AI会根据这些关键词推荐符合描述的美食,类似于“猜你喜欢”的食物版本。
这对Agent的挑战在于,它需要:
- 跨模态理解:将抽象的感官描述转化为具体的食物。
- 强大的推理能力:从少量线索中推导出准确结论。
- 深厚的美食知识库:涵盖全球各地的美食文化和特色。
面对这个复杂度显著提升的任务,开发时间从之前的十几分钟延长到了半小时。
最终的成品如下所示。由于我们没有提出UI方面的特殊要求,成品界面相对简洁,但已达到及格线。App具备了应有的基本元素:恰当的应用命名、清晰的用户引导界面,甚至还有富有文学色彩的slogan。

最终成品访问地址:https://47upjztctd5b.space.minimax.io
在测试中,对于“童年”这类具象关联性强的关键词,App能返回“香草布丁”、“冰淇淋圣代”等匹配度较高的结果。然而,当面对“在人间”、“我的大学”这类更抽象的关键词时,系统便难以提供有效匹配。这其实暴露了底层数据库的局限性。但就功能实现而言,作为一个半小时内完成的作品,其表现已相当出色。如果能够匹配更专业的开发者和更丰富的数据库,这款“味觉侦探”App其实可以很快发展成为一个成熟的产品。

“味觉侦探”界面展示了关键词匹配结果。
个性化定制:打造专属文保地图
基于个人需求,我们尝试让MiniMax构建一个文保地图。市面上现有的产品,如华夏古迹图、文保在身边等,都无法完全满足个性化需求。它们要么性能不佳、UI粗糙,要么收录的文保单位数量有限,且夹杂了许多不需要的增值服务。
此前曾尝试将文保数据导入苹果地图、谷歌地图。苹果的问题在于不支持数据导入,每一个文保单位都需要手动创建。谷歌地图虽然支持数据导入,但很难满足一些个性化需求,例如将各个层级的文保单位(国保、省保、市保)分层显示。此外,它对数据行数有限制,最大只支持2000行,同时对网络环境也有较高要求。
在MiniMax的帮助下,我们成功制作了一个文保地图。相比谷歌地图,界面更加友好,有更详细的背景介绍。点击导航键后也可以跳转至高德地图进行导航。对于我们而言,这款应用的最大优势在于高度可定制化。即使不懂编程,也可以随时要求MiniMax根据想法进行后续的迭代和改进。
然而,目前这款应用的数据库仅收录了12个文保单位的信息。主要原因是,要获取包含经纬度的专业地理数据,通常需要特定的账号权限才能登录某些专业数据库,这超出了当前AI Agent的能力范围。
这使我们意识到一个现实:以MVP(最小化可行产品)的标准而言,这个文保地图是合格的。但是“一句话生成App”仍然是一个宣传口号,实际上在创建一个真正可用App的过程中,还需要大量的人工介入,无论是前期的产品文档撰写,还是之后的数据库支持、运营维护等。
AI Agent的本质:3D打印机般的定制化能力
总结MiniMax Agent的优点:
Gallery和Remix功能是出色的亮点,它们能够引导新用户创作、激发老用户的创作动力,并在更低的算力成本下提升社区的活跃度。
全栈开发能力是其贴近实际生产环境的重要特征。MiniMax集成了后端数据库、一键测试、部署等完整的开发链路,产出的产品具备真正的可用性和交互性。
至于缺点,坦率地说,MiniMax本身并没有明显的产品缺陷,它所表现出的问题主要源自两个层面:
- AI技术的内在约束:包括模型幻觉现象、对真实世界理解的局限性等,这些是当前AI技术发展阶段的共性问题。
- 人类认知的投射:AI技术的华丽前景往往折射出人类复杂的情感诉求,而这种期待本身就承载着人类认知的局限性。
对于当前的AI产品,我们观察到身边朋友们普遍存在一种矛盾复杂的感受。一方面是厌烦,AI产品层出不穷,“逆天”、“炸裂”等夸大词汇充斥着信息流,令人产生审美疲劳。另一方面又是恐惧——万一呢?万一真有他们说的那么好?那我的工作是不是会被淘汰?
虽然Agent在特定任务上展现了强大的能力,但在实际生产环境中,它还远未达到可以完全自主运行的水平。将Agent想象成一台3D打印机会更为恰当。
就像3D打印机能够将数字模型转化为物理物体,满足小规模、定制化的生产需求,当前的Agent也擅长处理特定、界限清晰的任务。它们可以根据明确的指令生成代码片段、撰写特定主题的文章或自动化重复性强的流程。这些应用场景通常是针对个人用户或小规模团队,用于实现个性化、快速迭代的目标。
然而,3D打印机无法替代大规模的工业化生产线。同样,当前的Agent也无法直接进入复杂的生产环境。大规模生产需要的是高度可预测、可靠且经过严格质量控制的系统,而当前的Agent缺乏这种稳定性。它们可能会产生“幻觉”,出现无法预料的错误,或者在面对复杂、多变的实际场景时表现出脆弱性。
客观地说,AI的能力其实处在一个中间态。它确实展现了前所未有的强大能力,却又存在着明显的缺陷。与其说它有多么强大,更准确的描述是,它承诺了一个充满可能性的未来。
实际上,只要再深入了解一下,就可以轻易发现AI的脆弱。正如杨立昆所说,现在大语言模型本质上是一种“统计机器”,它通过在海量的文本数据中学习词语之间的统计关联性,来预测下一个最有可能出现的词。
换句话说,AI并不真正理解世界,其本质是猜测,是一种对人类行为的模拟。一个模型可以学会“火很热”和“水能灭火”的词语关联,但它不知道为什么火是热的,也不知道水如何从物理层面扑灭火焰,它只是在复述训练数据中已有的模式。就像你教小狗做出“恭喜发财”的动作一样。小狗当然不懂什么是恭喜发财,但是这么做之后,就会有零食奖励。AI也是如此。











