技术理想主义的破茧重生:MiniMax闫俊杰的'心舟'飞渡

1

在人工智能浪潮席卷全球的今天,中国科技创业者正迎来前所未有的机遇与挑战。MiniMax创始人闫俊杰的创业历程,恰如一艘'心舟',在技术与商业的汪洋中破浪前行,穿越了理想与现实的万重山峦。本文将深入探讨这位技术极客如何突破传统束缚,在大模型时代重塑技术创业的价值坐标。

从技术极客到行业领袖的蜕变

闫俊杰的创业故事始于一个深夜。2020年,当他第一次读到CLIP论文时,那种震撼感让他连续两三天无法入眠。这篇论文揭示了文本和图像在深度学习底层本质上的统一性,意味着AI 1.0时代的死结解开了——只要预训练模型做得足够好,AI就能通用地处理世间万物。

"当这件事发生时,如果你真的相信人工智能,你就应该去做点什么。"闫俊杰在罗永浩的采访中回忆道。正是这种对技术的纯粹信仰,促使他辞去商汤科技最年轻CTO的职位,在2021年底就踏上了AI创业的征程,比ChatGPT的诞生还要早一年。

在商汤科技7年的经历,让闫俊杰深刻体会到AI 1.0时代的局限性:"那是一个模型不通用,只能靠工具补齐的时代。A有需求就为A定制一个模型,B有需求就为B定制一个模型。业内唯一能做的通用化努力,只是把生产工具做通用了,用来更批量地生产那些注定无法通用的模型。"

AI技术演进

这种范式看似热闹,但本质上没有跳出做项目的桎梏,边际成本极高,社会价值却很薄。在这个技术底座上,根本不可能做一个"纯粹"的技术创业。这一度让他感到沮丧和迷茫,但也正是这种困境,催生了他对通用AI的坚定追求。

技术纯粹性的坚守与代价

在闫俊杰的创业哲学中,"纯粹"是一个关键词。这种纯粹性体现在他对技术路线的坚持上,即使这意味着要付出巨大代价。

2023年,当大多数AI创业者还在研究如何复现LLaMA时,MiniMax决定要做MoE(混合专家模型)。这是一个大胆的选择,因为在当时,除了不开源的OpenAI,外界几乎没有成熟参考,这是一片无人区。选择这条路,意味着没有开源社区的作业可抄,一切都要摸黑探索。

代价是惨重的——MiniMax经历了3到4次严重的预训练失败,每一次模型崩了,就意味着两个月的研发周期白费,以及单次高达1500万美金的算力成本打了水漂。然而,闫俊杰坚信MoE架构的上限更高,"为了那个能支撑起大几千亿参数的上限,他需要更纯粹,必须忽略'算小账'。"

在创业第一天,闫俊杰的动力和决心就来自于一个坚定的论断:真正的AGI一定是多模态的。对于一个早期资源有限的创业公司,坚持文本、语音、视觉三线并行确实少见,因为在旁人眼中这是"兵力分散"。

多模态AI技术

最终让闫俊杰坚持践行这个论断的,本质上还是基于第一性原理的"纯粹"。他发自内心地相信Scaling Law,相信不同模态在深度学习层面是等价的,那么即便早期众所周知的算力限制,不能上来就搞"原生多模态",MiniMax还是坚持把它们作为三个独立模型训练,始终为最终的融合做准备。

"选择单独的模态聚焦'放卫星'维持'技术形象',是资源有限条件下的'精神胜利法'。但如果更纯粹一些去看技术竞争的底层,还是需要直面有限资源,但不能放弃解决根本问题。哪怕要走之字形路线,要有点悲壮的长期'追赶',也没关系。因为这才是那个'更纯粹的选择。'"

冲击中的道路自信构建

2025年春节,DeepSeek R1的突然爆发,给整个国内大模型行业带来了巨大冲击。那种震撼感,不亚于当年的ChatGPT,几乎在一段时间内把所有国内大模型创业者都"干自闭了",所有人都沉默了相当长时间。

在闫俊杰看来,这种冲击反而成为了构建"道路自信"的契机。他在与罗永浩的对谈中坦言,曾经陷入了长久的自我反思:"是技术路线有问题吗?是我们的团队降低了要求?还是我们搞了其他的杂念,在追求AGI的路上不够坚定了?"

面对国内同级生里出现了得高分的同学,这已经动摇了大家反正都相对落后硅谷的"模糊状态",这时候必须对于是否要继续海量投入,继续在模型本身较劲追赶甚至寻求超越做出选择。

AI技术竞争格局

闫俊杰的选择是把自己更彻底地扔进模型技术这个更纯粹的维度去死磕。曾经被外界还有猜测所谓依托模型可用能力"沿途下蛋"做产品工厂,去抓用户提收入,进而支撑估值逻辑的另一种路线,反而明确不存在了。他的选择是"华山只有一条路"和"狭路相逢不能躲"。

有意思的是,他还做了一个极其实用、也极其简单有效的决定——在战略上坚决聚焦技术,同时组织上,发更多的钱!用这种最直接实在的方式,让大家把丢掉的信心捡回来,把分散的注意力聚回来。还是那个逻辑,忠于目标,做该做的有效动作,不要有"羞耻感"。

2025年这一年,MiniMax的聚焦和坚定之后,确实连续打赢了三场坚定信心的硬仗:

  1. 架构创新的抢跑:2025年1月,当行业还在Transformer的舒适区里内卷时,MiniMax率先发布了国内首个线性注意力架构(Linear Attention)模型MiniMax-Text 01;6月,更是开源了全球首个大规模混合架构推理模型MiniMax-M1。

  2. 底层算法的反向输出:在M1模型中,MiniMax还提出了一种全新的强化学习算法CISPO。这不仅仅是一个技术名词,因为随后硅谷巨头Meta发布的ScaleRL训练框架也采用了这一算法。这是中国创业公司在底层算法逻辑上,对国际巨头的一次罕见且硬核的技术输出。

  3. 定义交互的新标准:到了10月,随着M2模型的发布,MiniMax首次将Interleaved Thinking(交错思维链)推向了行业标准。这种让模型"像人一样边想边做"的能力,迅速获得了OpenRouter等国外知名开发者平台的支持。

这三场战役之后,闫俊杰似乎展现出一种不同以往的松弛感。在与老罗的交流中,他坦诚地盘点了MiniMax的家底:"两年前,他们的语音模型做到了国际领先;一年前,视频生成模型也冲到了国际前沿;连音乐模型现在也是全球三强。唯独语言模型,之前一直还要差点火候。但随着这次新模型M2的发布,MiniMax的语言模型得到了国际开发者的认可,开始被用来做Agent和写代码——这意味着MiniMax补齐了最后一块短板。"

全球AI竞争中的中国效率优势

闫俊杰向罗永浩描绘了一个比外界认知更加残酷的AI技术竞争格局。他认为在美国,真正能坐在大模型牌桌上的其实只有四家公司:OpenAI、Google、Anthropic,以及X.AI。而他心中MiniMax的位置,则是成为全球极少数具备全模态整合能力的公司。

"客观来看,我们可能是中国唯一一家,在文本、视频、语音、音乐全模态上都做到国际领先的公司。"闫俊杰自信地表示。

全模态AI技术

让他在这个全球技术格局中保持自信的,是中国公司独特的"效率优势"。他跟老罗算了一笔账:"美国的这四家核心公司,估值和收入可能是中国公司的100倍,但技术领先幅度可能只剩下5%。中国公司花美国同行1/50的钱,做出来的效果只差5%,而且这个差距还在缩小。"

闫俊杰相信当全模态的数据和模型完成最终整合时,将通向一个从量变到质变的时刻。"我们现在还没有合在一起。我觉得实际上现在是我们最虚弱的时候。"这句话的坦诚是符合闫俊杰的性格的,但这句"现在是我们最脆弱的时候"在公开访谈里说出来,是不符合他这些年来对外沟通的谨慎风格的。这种变化,只能说明他内心已经完成某种印证"道路自信"的构建。

能说自己现在很脆弱的人,大多不那么脆弱。他已经看到了某种明确技术能力上的自信。其实闫俊杰是一位非常关注底层逻辑的人,但如果有自信,一定是因为一些底层逻辑得到了验证。比如过去两年外界对谷歌一度非常看衰,觉得巨头掉队了。但闫俊杰却一直非常笃定地跟我说:"谷歌一定会追上来","他们的TPU,非常值得关注进展"。

现在看来他说的是对的,他看透了算力基建对模型迭代的决定性支撑,以及TPU和模型深度共振的意义。今年Google的帝国反击战,确实也和其充分利用了TPU这个阵地,进行了充分发挥优势的技术突破紧密相关。

理想主义羞耻感的破除

曾几何时,在中国做一家真正的技术公司,想很纯粹地依托技术本身形成大的商业价值闭环,是无比艰难的。过去很多年,所谓技术公司跑到最后,技术本身都往往只是个在最终价值创造中看似不可或缺,但其实也占比很少的东西。

这可能来自于技术本身在特定时期的局限,也一定和我们的特定时期的商业环境有关。但不管怎样,那些出发时候带着技术信仰和热情的创业者们,很多人也被商业世界的调教到要不就是放弃最初的目标,要不就是不得不接受现实,去适配环境,甚至被环境所改造。

由于几乎没有新兴技术创业公司的成功案例,以至于一段时间以来,技术理想这个真正的"核动力",在一个人或者公司没做出伟大成果之前,都是"不足为外人道也"。甚至是在商业世界你公开说"理想和追求",都成了有点"羞耻感"的东西,因为很少有人理解和相信,还会觉得你装X。

但到了今天这个新的技术时代和新的社会环境,情况应该开始改变了。很多人觉得只有硅谷可以支持"技术理想",但我觉得不要简单接受结论,而是要拆解为什么是这样,以及改变怎样才能发生。

技术理想主义

历史可以告诉未来,但历史不会就是未来。这种改变需要的可能就是一个合适的技术时代和一个足够成功的案例,之后星星之火未必不能燎原。就像很多人都没意识到,DJI这样的一家公司,在深圳就激励了多少新的硬件创业者敢于鄙视"性价比",进而敢于要做全球最好的产品,拿到最高的毛利,然后做更伟大的公司。今天这不就是新的常态吗?

"纯粹"是有意义的,把更高的技术追求和更大的商业价值结果变成一个统一逻辑,开始成为越来越符合时代和环境的技术创业路径。

看了闫俊杰和罗永浩这四个小时的交流,能感受到闫俊杰这几年的从思考到实践的闭环,正在打破一种隐形的"理想主义羞耻感",不再把技术追求包裹到某个流行的,为了取悦投资人的商业故事里,而是写下一个自带生命力的、统一的新故事。

它的好处是,你不再对世界有局促和含蓄,而变成了坦荡——只要你自己足够相信这个"大一统"故事,就可以说出来和值得做下去。该羞耻的是那些只看见历史,而不敢下注未来的人,不是这些技术创业者们。

在和老罗的采访中,闫俊杰有一段说得挺好的:"如果要反思技术做得好,到底需要什么。他把它总结为两个词,一个是想象力,一个是自信。美国企业在自信方面做得很好,他们敢于讲我要引领这个行业。中国科技企业要更上一个层面,要引领世界,归根结底也需要坦荡的自信。"

世界总有人会相信和支持你,管他是因为发自内心的认同,还是不明就里的FOMO。时代给了技术创业者伟大的机遇,如果本身所有投资人最终都要浪费95%的钱(这就是风险投资投资的本质),就让他们都浪费在"哥伦布"身上,这才更有意义。

结语:心舟飞渡万重山

闫俊杰的创业历程,恰如一艘"心舟",在技术与商业的汪洋中破浪前行。从最初的技术极客,到如今能够坦然面对全球AI竞争格局的行业领袖,他的蜕变反映了中国技术创业者在新时代的成长轨迹。

大模型带来的一个变化,就是新时代的中国技术创业者,即便依旧需要商业世界的支持,也终于可以放下技术理想带来的"羞耻感"了。这种变化,不仅是个人的突破,更是一个时代的信号——技术理想主义正在中国科技企业中重新焕发生机。

闫俊杰打了个样,希望他继续纵情向前。也希望更多新一代中国技术创业者们,在这一个全新的技术时代,保持纯粹,"心舟飞渡万重山"。