闫俊杰与MiniMax：技术创业者的'心舟'如何飞越AI万重山

在AI技术迅猛发展的今天，中国科技创业生态正在经历一场深刻变革。MiniMax创始人闫俊杰从商汤科技CTO到独立创业的历程，不仅代表了一代技术创业者的转型，更折射出中国AI产业从跟随到引领的艰难蜕变。本文将深入剖析闫俊杰的创业哲学、技术路线选择以及在激烈竞争中的战略定力，揭示中国技术创业者如何在AI新时代实现突破。

纯粹技术创业：从商汤到MiniMax的初心

闫俊杰的技术创业之路始于一个深夜。当他在2020年读到CLIP论文时，那种震撼感让他连续几夜无法入眠。这篇论文揭示了文本和图像在深度学习底层本质上的统一性，彻底改变了他对AI发展的认知。

"当这件事发生时，如果你真的相信人工智能，你就应该去做点什么。"

这句话成为闫俊杰创业的起点。在此之前，他在商汤科技担任CTO，经历了AI 1.0时代的整个周期。在那个时代，模型不通用，只能靠工具补齐，业内唯一能做的通用化努力，只是把生产工具做通用，用来更批量地生产那些注定无法通用的模型。

"这种范式看起来热闹，但本质上没有跳出做项目的桎梏，边际成本极高，社会价值却很薄。"闫俊杰在极客公园前沿社冬季会晤中曾这样描述那个技术时代的无奈。

CLIP技术突破

CLIP论文带来的技术突破让闫俊杰看到了AI发展的新方向

MiniMax创立之初，其旗下的Glow产品每天处理着数以亿计的Token，体量一度超过早期的ChatGPT。然而，闫俊杰并不满足于此。一次因参数调整导致对话智能度轻微下降，三天内活跃用户就跌去30%的事故，让他深刻认识到：依托技术创新的商业回报不是靠运营、技巧和工程复杂度堆砌的，而是底层技术能力的直接映射。

"追求AGI与追求商业回报不再是两条平行线，而是完全重合的同一条曲线——智能每提升一分，用户的留存时长就增加一分。漂亮的商业数据不再是技术的对立面，而是检验模型是否逼近AGI真相的唯一试卷。"

这一认知成为MiniMax所有决策的底层逻辑。2023年，当大多数中国AI公司还在研究如何复现LLaMA时，MiniMax决定要做MoE（混合专家模型）。这是一条充满风险的道路——除了不开源的OpenAI，外界几乎没有成熟参考，MiniMax经历了3到4次严重的预训练失败，每一次模型崩了，就意味着两个月的研发周期白费，以及单次高达1500万美金的算力成本打了水漂。

"时代给了搞技术的新环境，这时候最关键的就是不能有'烧钱的羞耻感'，这背后核心是要有信仰和够坚定。如果相信MoE架构的上限更高，为了那个能支撑起大几千亿参数的上限，他需要更纯粹，必须忽略'算小账'。"

冲击与蜕变：DeepSeek R1带来的行业震荡

2025年春节，DeepSeek R1的突然爆发，给整个国内大模型行业带来了巨大冲击。那种震撼感，不亚于当年的ChatGPT，几乎在一段时间内把所有国内大模型创业者都"干自闭了"，所有人都沉默了相当长时间。

闫俊杰在罗永浩的访谈中坦诚回溯了那个时刻："别人的成果突破带来的冲击，直接让我开始自省：是技术路线有问题吗？是我们的团队降低了要求？还是我们搞了其他的杂念，在追求AGI的路上不够坚定了？"

DeepSeek R1技术突破

DeepSeek R1的突破让整个中国AI行业陷入深度反思

面对国内同级生里出现了得高分的同学，这动摇了大家反正都相对落后硅谷的"模糊状态"，所有AI公司都必须做出选择：是否要继续海量投入，继续在模型本身较劲追赶甚至寻求超越？

据了解，闫俊杰的选择是把公司更彻底地扔进模型技术这个更纯粹的维度去死磕。曾经被外界猜测的"依托模型可用能力'沿途下蛋'做产品工厂，去抓用户提收入，进而支撑估值逻辑"的路线，被明确否决了。闫俊杰的选择是"华山只有一条路"和"狭路相逢不能躲"。

有意思的是，他还做了一个极其实用、也极其简单有效的决定——在战略上坚决聚焦技术，同时组织上，发更多的钱！用这种最直接实在的方式，让大家把丢掉的信心捡回来，把分散的注意力聚回来。

三场硬仗：MiniMax的反击与自信建立

2025年，MiniMax的聚焦和坚定之后，连续打赢了三场坚定信心的硬仗，这些战役不仅提升了技术实力，更重要的是建立了整个团队的自信。

架构创新的抢跑

2025年1月，当行业还在Transformer的舒适区里内卷时，MiniMax率先发布了国内首个线性注意力架构（Linear Attention）模型MiniMax-Text 01；6月，更是开源了全球首个大规模混合架构推理模型MiniMax-M1。

线性注意力架构

MiniMax的线性注意力架构代表了AI模型架构的创新探索

虽然后来的M2模型并未完全沿用这一特定架构，但这种敢于偏离主流的探索本身，证明了MiniMax绝不是只会等着硅谷发论文再跟进的好学生，而是真正严肃的AGI挑战者——敢于为了更高的上限，去试错别人没走过的路，去无人区寻找更优解。

底层算法的反向输出

在M1模型中，MiniMax提出了一种全新的强化学习算法CISPO。这不仅仅是一个技术名词，因为随后硅谷巨头Meta发布的ScaleRL训练框架也采用了这一算法。这是中国创业公司在底层算法逻辑上，对国际巨头的一次罕见且硬核的技术输出。

"中国花美国同行1/50的钱，做出来的效果只差5%，而且这个差距还在缩小。"闫俊杰在访谈中这样描述中国公司的效率优势。

定义交互的新标准

到了10月，随着M2模型的发布，MiniMax首次将Interleaved Thinking（交错思维链）推向了行业标准。这种让模型"像人一样边想边做"的能力，迅速获得了OpenRouter等国外知名开发者平台的支持。随后，不少大模型公司才纷纷跟进。这一次，不再是硅谷定义规则，而是MiniMax在定义什么是"更好的交互"。

交错思维链技术

MiniMax的交错思维链技术重新定义了AI交互标准

这三场战役之后，闫俊杰的状态发生了明显变化。在和老罗的对谈中，出现了一种前所未有的松弛感。这种松弛感可能源于他手里拼图的最后一块——文本模型，终于拼上了。

"两年前，我们的语音模型做到了国际领先；一年前，视频生成模型也冲到了国际前列；连音乐模型现在也是全球三强。唯独语言模型，之前一直还要差点火候。但随着这次新模型M2的发布，MiniMax的语言模型得到了国际开发者的认可，开始被用来做Agent和写代码——这意味着MiniMax补齐了最后一块短板。"

全模态整合：MiniMax的终极目标

闫俊杰向罗永浩描绘了一个比外界认知更加残酷的AI技术竞争格局。他认为在美国，真正能坐在大模型牌桌上的其实只有四家公司：OpenAI、Google、Anthropic，以及X.AI。而他心中MiniMax的位置，则是成为全球极少数具备全模态整合能力的公司。

"客观来看，我们可能是中国唯一一家，在文本、视频、语音、音乐全模态上都做到国际领先的公司。"

让他在这个全球技术格局中保持自信的，是中国公司独特的"效率优势"。闫俊杰相信当全模态的数据和模型完成最终整合时，将通向一个从量变到质变的时刻。

"我们现在还没有合在一起。我觉得实际上现在是我们最虚弱的时候。"

这句话的坦诚是符合闫俊杰的性格的，但在公开访谈里说出"现在是我们最脆弱的时候"，不符合他这些年来对外沟通的谨慎风格。这种变化只能说明他内心已经完成了某种印证"道路自信"的构建。

能说自己现在很脆弱的人，大多不那么脆弱。闫俊杰是一位非常关注底层逻辑的人，如果有自信，一定是因为一些底层逻辑得到了验证。比如过去两年外界对谷歌一度非常看衰，觉得巨头掉队了。但闫俊杰却一直非常笃定地跟我说："谷歌一定会追上来"，"他们的TPU，非常值得关注进展"。

现在看来他说的是对的，他看透了算力基建对模型迭代的决定性支撑，以及TPU和模型深度共振的意义。今年Google的帝国反击战，确实也和其充分利用了TPU这个阵地，进行了充分发挥优势的技术突破紧密相关。

全模态AI整合

MiniMax的全模态AI整合代表了未来AI发展的方向

技术理想与商业价值的统一

曾几何时，在中国做一家真正的技术公司，想很纯粹地依托技术本身形成大的商业价值闭环，是无比艰难的。过去很多年，所谓技术公司跑到最后，技术本身都往往只是个在最终价值创造中看似不可或缺，但其实也占比很少的东西。

这可能来自于技术本身在特定时期的局限，也一定和我们的特定时期的商业环境有关。但不管怎样，那些出发时候带着技术信仰和热情的创业者们，很多人也被商业世界的调教到要不就是放弃最初的目标，要不就是不得不接受现实，去适配环境，甚至被环境所改造。

由于几乎没有新兴技术创业公司的成功案例，以至于一段时间以来，技术理想这个真正的"核动力"，在一个人或者公司没做出伟大成果之前，都是"不足为外人道也"。甚至是在商业世界你公开说"理想和追求"，都成了有点"羞耻感"的东西，因为很少有人理解和相信，还会觉得你装X。

但到了今天这个新的技术时代和新的社会环境，情况也应该开始改变了。很多人觉得只有硅谷可以支持"技术理想"，但我觉得不要简单接受结论，而是要拆解为什么是这样，以及改变怎样才能发生。

历史可以告诉未来，但历史不会就是未来。这种改变需要的可能就是一个合适的技术时代和一个足够成功的案例，之后星星之火未必不能燎原。

就像很多人都没意识到，DJI这样的一家公司，在深圳就激励了多少新的硬件创业者敢于鄙视"性价比"，进而敢于要做全球最好的产品，拿到最高的毛利，然后做更伟大的公司。今天这不就是新的常态吗？

"纯粹"是有意义的，把更高的技术追求和更大的商业价值结果变成一个统一逻辑，开始成为越来越符合时代和环境的技术创业路径。

看了闫俊杰和罗永浩这四个小时的交流，能感受到闫俊杰这几年的从思考到实践的闭环，正在打破了一种隐形的"理想主义羞耻感"，不再把技术追求包裹到某个流行的，为了取悦投资人的商业故事里，而是写下一个自带生命力的、统一的新故事。

它的好处是，你不再对世界有局促和含蓄，而变成了坦荡——只要你自己足够相信这个"大一统"故事，就可以说出来和值得做下去。该羞耻的是那些只看见历史，而不敢下注未来的人，不是这些技术创业者们。

在和老罗的采访中，闫俊杰有一段说得挺好的："如果要反思技术做得好，到底需要什么。他把它总结为两个词，一个是想象力，一个是自信。美国企业在自信方面做得很好，他们敢于讲我要引领这个行业。中国科技企业要更上一个层面，要引领世界，归根结底也需要坦荡的自信。"

世界总有人会相信和支持你，管他是因为发自内心的认同，还是不明就里的FOMO。时代给了技术创业者伟大的机遇，如果本身所有投资人最终都要浪费95%的钱（这就是风险投资的本质），就让他们都浪费在"哥伦布"身上，这才更有意义。

结语：新一代中国技术创业者的崛起

闫俊杰的创业历程，是中国技术创业者在新AI时代的一个缩影。从商汤CTO到MiniMax创始人，他经历了从大公司体系到独立创业的转变；从AI 1.0时代的无奈到AGI时代的坚定，他见证并参与了中国AI产业的崛起；从技术理想主义的羞耻感到坦荡自信的表达，他代表了中国新一代技术创业者的蜕变。

"心舟已过万重山"，这句诗恰如其分地描述了闫俊杰和MiniMax已经走过的艰难历程。然而，正如闫俊杰自己所说："现在是我们最虚弱的时候"——全模态的整合尚未完成，技术竞争还在继续，商业价值尚未完全释放。

但正是这种"脆弱"中的自信，才更加珍贵。中国科技企业正在从"跟随者"向"引领者"转变，从"性价比思维"向"价值创造思维"转变，从"技术理想羞耻感"向"坦荡自信"转变。

闫俊杰打了个样，我希望他继续纵情向前。也希望更多新一代中国技术创业者们，在这一个全新的技术时代，保持纯粹，"心舟飞渡万重山"。