闫俊杰：中国技术创业者的'心舟'如何飞渡AI万重山

在AI技术浪潮席卷全球的今天，中国技术创业者正经历着前所未有的机遇与挑战。MiniMax创始人闫俊杰的创业故事，不仅代表了一代技术人的成长轨迹，更折射出中国科技企业在全球AI竞争中的独特定位与思考。

从商汤CTO到AI创业先锋：一个技术极客的觉醒

闫俊杰的科技之路始于对技术的纯粹热爱。据他回忆，早在大学时期，他就是极客公园创始人张鹏科技杂志的忠实读者，对当时关于科技趋势的'暴论'观点如数家珍。这种对技术的敏感与执着，成为他日后创业的基石。

在商汤科技担任最年轻CTO的7年间，闫俊杰经历了AI 1.0时代的完整周期。那时的AI行业面临着模型不通用、只能靠工具补齐的困境。'那是一个模型不通用，只能靠工具补齐的时代。A有需求就为A定制一个模型，B有需求就为B定制一个模型。'闫俊杰在极客公园前沿社冬季会晤中曾这样描述那个时代的无奈。

这种范式看似热闹，但本质上没有跳出做项目的桎梏，边际成本极高，社会价值却很薄。'这个技术底座上，根本不可能做一个'纯粹'的技术创业。'这一度让他陷入沮丧与迷茫。

转机出现在2020年一个深夜，当闫俊杰第一次读到CLIP论文时，那种冲击感让他激动得两三天没睡着觉。'他在那篇论文里看到了一个惊人的未来：文本和图像之间的柏林墙倒塌了，它们在深度学习的底层本质上是统一的。'这意味着AI 1.0的死结解开了——只要预训练模型做得足够好，AI就能通用地处理世间万物。

'当这件事发生时，如果你真的相信人工智能，你就应该去做点什么。'基于这一信念，闫俊杰几乎立即决定All in开始自己的AI创业，创立了MiniMax。

技术纯粹性的坚守：在无人区探索的勇气

2022年末ChatGPT横空出世时，MiniMax旗下的Glow每天已处理着数以亿计的Token，体量一度超过早期的ChatGPT。然而，闫俊杰并不满足于此。'Glow停留在娱乐层面，并非产品定位的主动选择，而是被当时的技术水位锁死了边界——是一个模型的技术能力，决定了一个产品的最终形态。'

这一认知被随后的一次事故残酷印证：仅仅因为一次参数调整导致对话智能度轻微下降，三天内活跃用户就跌去了30%。这让他进一步确信，'依托技术创新的商业回报不是靠运营、技巧和工程复杂度堆砌的，而是底层技术能力的直接映射。'

在这个逻辑里，追求AGI与追求商业回报不再是两条平行线，而是完全重合的同一条曲线——'智能每提升一分，用户的留存时长就增加一分。漂亮的商业数据不再是技术的对立面，而是检验模型是否逼近AGI真相的唯一试卷。'

基于这一认知，MiniMax做出了一系列在当时看来难以理解的决策。2023年，当大多数人还在研究如何复现LLaMA时，MiniMax决定要做MoE（混合专家模型）。'在当时，除了不开源的OpenAI，外界几乎没有成熟参考，这是一片无人区。'闫俊杰坦言。

选择这条路，意味着没有开源社区的作业可抄，一切都要摸黑探索。代价是惨重的——MiniMax经历了3到4次严重的预训练失败，每一次模型崩了，就意味着两个月的研发周期白费，以及单次高达1500万美金的算力成本打了水漂。

'时代给了搞技术的新环境，这时候最关键的就是不能有'烧钱的羞耻感'，这背后核心是要有信仰和够坚定。'闫俊杰说道，'如果相信MoE架构的上限更高，为了那个能支撑起大几千亿参数的上限，他需要更纯粹，必须忽略'算小账'。'

同样值得注意的是，在创业第一天，闫俊杰就坚持多模态并行发展的战略。'在创业第一天，他的动力和决心都是来自于一个论断：真正的AGI一定是多模态的。'对于一个早期资源有限的创业公司，坚持文本、语音、视觉三线并行确实少见，因为在旁人眼中这是'兵力分散'。

最终让闫俊杰坚持践行这一论断的，本质上还是基于第一性原理的'纯粹'。'他发自内心的相信Scaling Law，相信不同模态在深度学习层面是等价的，那么即便早期众所周知的算力限制，不能上来就搞'原生多模态'，但是MiniMax还是坚持把它们作为三个独立模型训练。'

深度冲击与道路自信：在危机中寻找突破

'我相信对闫俊杰和国内其它很多大模型创业者，2025年都是天崩开局。'张鹏在文章中写道。2025年春节，DeepSeek R1的突然爆发，给整个国内大模型行业带来了巨大冲击。'那种震撼感，不亚于当年的ChatGPT，几乎在一段时间内把所有国内大模型创业者都'干自闭了'，所有人都沉默了相当长时间。'

闫俊杰在和老罗的采访中坦诚回溯了那个时刻，'他也陷入了长久的自我反思。别人的成果突破带来的冲击，直接让他开始自省：是技术路线有问题吗？是我们的团队降低了要求？还是我们搞了其他的杂念，在追求AGI的路上不够坚定了？'

面对这种冲击，闫俊杰做出了两个关键决定：在战略上更聚焦技术，在组织上发更多的钱。'用这种最直接实在的方式，让大家把丢掉的信心捡回来，把分散的注意力聚回来。还是那个逻辑，忠于目标，做该做的有效动作，不要有'羞耻感'。'

2025年，MiniMax的聚焦和坚定带来了连续三场硬仗的胜利：

架构创新的抢跑：2025年1月，当行业还在Transformer的舒适区里内卷时，MiniMax率先发布了国内首个线性注意力架构（Linear Attention）模型MiniMax-Text 01；6月，更是开源了全球首个大规模混合架构推理模型MiniMax-M1。
底层算法的反向输出：在M1模型中，MiniMax提出了一种全新的强化学习算法CISPO。随后硅谷巨头Meta发布的ScaleRL训练框架也采用了这一算法，这是中国创业公司在底层算法逻辑上对国际巨头的罕见技术输出。
定义交互的新标准：10月，随着M2模型的发布，MiniMax首次将Interleaved Thinking（交错思维链）推向了行业标准，这种让模型'像人一样边想边做'的能力迅速获得了OpenRouter等国外知名开发者平台的支持。

这三场战役之后，闫俊杰展现出一种前所未有的松弛感。'能说自己现在很脆弱的人，大多不那么脆弱。'张鹏观察道，'他已经看到了某种明确技术能力上的自信。'

闫俊杰向老罗描绘了一个比外界认知更加残酷的AI技术竞争格局：'在美国，真正能坐在大模型牌桌上的其实只有四家公司：OpenAI、Google、Anthropic，以及X.AI。那么他心中MiniMax的位置，则是成为全球极少数具备全模态整合能力的公司。'

'客观来看，我们可能是中国唯一一家，在文本、视频、语音、音乐全模态上都做到国际领先的公司。'闫俊杰自信地表示。这种自信源于中国公司独特的'效率优势'——'中国公司花美国同行1/50的钱，做出来的效果只差5%，而且这个差距还在缩小。'

打破'理想主义羞耻感'：技术追求与商业价值的统一

'曾几何时，在中国做一家真正的技术公司，想很纯粹的依托技术本身形成大的商业价值闭环，是无比艰难的。'张鹏在文章中感慨道。过去很多年，所谓技术公司跑到最后，技术本身往往只是个在最终价值创造中看似不可或缺，但其实占比很少的东西。

由于几乎没有新兴技术创业公司的成功案例，技术理想这个真正的'核动力'，在一个人或公司没做出伟大成果之前，都是'不足为外人道也'。'甚至是在商业世界你公开说'理想和追求'，都成了有点'羞耻感'的东西，因为很少有人理解和相信，还会觉得你装X。'

但闫俊杰和MiniMax的实践正在改变这一现状。'看了闫俊杰和罗永浩这四个小时的交流，能感受到闫俊杰这几年的从思考到实践的闭环，正在打破了一种隐形的'理想主义羞耻感'，不再把技术追求包裹到某个流行的、为了取悦投资人的商业故事里，而是写下一个自带生命力的、统一的新故事。'

在和老罗的采访中，闫俊杰将技术成功的关键总结为两个词：'一个是想象力，一个是自信。美国企业在自信方面做得很好，他们敢于讲我要引领这个行业。中国科技企业要更上一个层面，要引领世界，归根到底也需要坦荡的自信。'

这种自信源于对技术本质的深刻理解。'世界总有人会相信和支持你，管他是因为发自内心的认同，还是不明就里的FOMO。时代给了技术创业者伟大的机遇，如果本身所有投资人最终都要浪费95%的钱（这就是风险投资的本质），就让他们都浪费在'哥伦布'身上，这才更有意义。'

闫俊杰打了个样，展现了中国技术创业者在新时代的可能路径。保持纯粹的技术追求，同时建立全球化的视野与自信，这或许是新一代中国科技企业突破重围的关键。

结语：心舟飞渡万重山

闫俊杰的创业故事，是中国技术创业者在新AI时代的一个缩影。从商汤CTO到AI创业先锋，从技术极客到行业领导者，他的转变不仅是个人的成长，更代表了一代中国科技人的觉醒与蜕变。

在DeepSeek等国内技术突破的冲击下，闫俊杰没有选择退缩或改变路线，而是更加坚定地走在纯粹的技术追求之路上。这种'道路自信'的建立，源于对技术本质的深刻理解，也源于对中国科技企业独特优势的清醒认知。

'纯粹'是有意义的，把更高的技术追求和更大的商业价值结果变成一个统一逻辑，开始成为越来越符合时代和环境的技术创业路径。闫俊杰和MiniMax的实践证明，中国技术创业者完全可以打破'理想主义羞耻感'，在商业世界中坦荡地追求技术理想。

正如文章标题所隐喻的，中国技术创业者的'心舟'正在飞渡AI的万重山。这条道路充满挑战，但也充满希望。闫俊杰的故事告诉我们，在这个全新的技术时代，保持纯粹、坚定自信，中国科技企业完全有可能在全球AI竞争中占据一席之地，甚至引领未来的发展方向。

AI技术发展

图：AI技术发展历程中的关键突破点