在AI技术浪潮席卷全球的今天,中国技术创业者正经历着前所未有的机遇与挑战。MiniMax创始人闫俊杰的创业故事,不仅代表了一代技术人的成长轨迹,更折射出中国科技企业在全球AI竞争中的独特定位与思考。
从商汤CTO到AI创业先锋:一个技术极客的觉醒
闫俊杰的科技之路始于对技术的纯粹热爱。据他回忆,早在大学时期,他就是极客公园创始人张鹏科技杂志的忠实读者,对当时关于科技趋势的'暴论'观点如数家珍。这种对技术的敏感与执着,成为他日后创业的基石。
在商汤科技担任最年轻CTO的7年间,闫俊杰经历了AI 1.0时代的完整周期。那时的AI行业面临着模型不通用、只能靠工具补齐的困境。'那是一个模型不通用,只能靠工具补齐的时代。A有需求就为A定制一个模型,B有需求就为B定制一个模型。'闫俊杰在极客公园前沿社冬季会晤中曾这样描述那个时代的无奈。
这种范式看似热闹,但本质上没有跳出做项目的桎梏,边际成本极高,社会价值却很薄。'这个技术底座上,根本不可能做一个'纯粹'的技术创业。'这一度让他陷入沮丧与迷茫。
转机出现在2020年一个深夜,当闫俊杰第一次读到CLIP论文时,那种冲击感让他激动得两三天没睡着觉。'他在那篇论文里看到了一个惊人的未来:文本和图像之间的柏林墙倒塌了,它们在深度学习的底层本质上是统一的。'这意味着AI 1.0的死结解开了——只要预训练模型做得足够好,AI就能通用地处理世间万物。
'当这件事发生时,如果你真的相信人工智能,你就应该去做点什么。'基于这一信念,闫俊杰几乎立即决定All in开始自己的AI创业,创立了MiniMax。
技术纯粹性的坚守:在无人区探索的勇气
2022年末ChatGPT横空出世时,MiniMax旗下的Glow每天已处理着数以亿计的Token,体量一度超过早期的ChatGPT。然而,闫俊杰并不满足于此。'Glow停留在娱乐层面,并非产品定位的主动选择,而是被当时的技术水位锁死了边界——是一个模型的技术能力,决定了一个产品的最终形态。'
这一认知被随后的一次事故残酷印证:仅仅因为一次参数调整导致对话智能度轻微下降,三天内活跃用户就跌去了30%。这让他进一步确信,'依托技术创新的商业回报不是靠运营、技巧和工程复杂度堆砌的,而是底层技术能力的直接映射。'
在这个逻辑里,追求AGI与追求商业回报不再是两条平行线,而是完全重合的同一条曲线——'智能每提升一分,用户的留存时长就增加一分。漂亮的商业数据不再是技术的对立面,而是检验模型是否逼近AGI真相的唯一试卷。'
基于这一认知,MiniMax做出了一系列在当时看来难以理解的决策。2023年,当大多数人还在研究如何复现LLaMA时,MiniMax决定要做MoE(混合专家模型)。'在当时,除了不开源的OpenAI,外界几乎没有成熟参考,这是一片无人区。'闫俊杰坦言。
选择这条路,意味着没有开源社区的作业可抄,一切都要摸黑探索。代价是惨重的——MiniMax经历了3到4次严重的预训练失败,每一次模型崩了,就意味着两个月的研发周期白费,以及单次高达1500万美金的算力成本打了水漂。
'时代给了搞技术的新环境,这时候最关键的就是不能有'烧钱的羞耻感',这背后核心是要有信仰和够坚定。'闫俊杰说道,'如果相信MoE架构的上限更高,为了那个能支撑起大几千亿参数的上限,他需要更纯粹,必须忽略'算小账'。'
同样值得注意的是,在创业第一天,闫俊杰就坚持多模态并行发展的战略。'在创业第一天,他的动力和决心都是来自于一个论断:真正的AGI一定是多模态的。'对于一个早期资源有限的创业公司,坚持文本、语音、视觉三线并行确实少见,因为在旁人眼中这是'兵力分散'。
最终让闫俊杰坚持践行这一论断的,本质上还是基于第一性原理的'纯粹'。'他发自内心的相信Scaling Law,相信不同模态在深度学习层面是等价的,那么即便早期众所周知的算力限制,不能上来就搞'原生多模态',但是MiniMax还是坚持把它们作为三个独立模型训练。'
深度冲击与道路自信:在危机中寻找突破
'我相信对闫俊杰和国内其它很多大模型创业者,2025年都是天崩开局。'张鹏在文章中写道。2025年春节,DeepSeek R1的突然爆发,给整个国内大模型行业带来了巨大冲击。'那种震撼感,不亚于当年的ChatGPT,几乎在一段时间内把所有国内大模型创业者都'干自闭了',所有人都沉默了相当长时间。'
闫俊杰在和老罗的采访中坦诚回溯了那个时刻,'他也陷入了长久的自我反思。别人的成果突破带来的冲击,直接让他开始自省:是技术路线有问题吗?是我们的团队降低了要求?还是我们搞了其他的杂念,在追求AGI的路上不够坚定了?'
面对这种冲击,闫俊杰做出了两个关键决定:在战略上更聚焦技术,在组织上发更多的钱。'用这种最直接实在的方式,让大家把丢掉的信心捡回来,把分散的注意力聚回来。还是那个逻辑,忠于目标,做该做的有效动作,不要有'羞耻感'。'
2025年,MiniMax的聚焦和坚定带来了连续三场硬仗的胜利:
架构创新的抢跑:2025年1月,当行业还在Transformer的舒适区里内卷时,MiniMax率先发布了国内首个线性注意力架构(Linear Attention)模型MiniMax-Text 01;6月,更是开源了全球首个大规模混合架构推理模型MiniMax-M1。
底层算法的反向输出:在M1模型中,MiniMax提出了一种全新的强化学习算法CISPO。随后硅谷巨头Meta发布的ScaleRL训练框架也采用了这一算法,这是中国创业公司在底层算法逻辑上对国际巨头的罕见技术输出。
定义交互的新标准:10月,随着M2模型的发布,MiniMax首次将Interleaved Thinking(交错思维链)推向了行业标准,这种让模型'像人一样边想边做'的能力迅速获得了OpenRouter等国外知名开发者平台的支持。
这三场战役之后,闫俊杰展现出一种前所未有的松弛感。'能说自己现在很脆弱的人,大多不那么脆弱。'张鹏观察道,'他已经看到了某种明确技术能力上的自信。'
闫俊杰向老罗描绘了一个比外界认知更加残酷的AI技术竞争格局:'在美国,真正能坐在大模型牌桌上的其实只有四家公司:OpenAI、Google、Anthropic,以及X.AI。那么他心中MiniMax的位置,则是成为全球极少数具备全模态整合能力的公司。'
'客观来看,我们可能是中国唯一一家,在文本、视频、语音、音乐全模态上都做到国际领先的公司。'闫俊杰自信地表示。这种自信源于中国公司独特的'效率优势'——'中国公司花美国同行1/50的钱,做出来的效果只差5%,而且这个差距还在缩小。'
打破'理想主义羞耻感':技术追求与商业价值的统一
'曾几何时,在中国做一家真正的技术公司,想很纯粹的依托技术本身形成大的商业价值闭环,是无比艰难的。'张鹏在文章中感慨道。过去很多年,所谓技术公司跑到最后,技术本身往往只是个在最终价值创造中看似不可或缺,但其实占比很少的东西。
由于几乎没有新兴技术创业公司的成功案例,技术理想这个真正的'核动力',在一个人或公司没做出伟大成果之前,都是'不足为外人道也'。'甚至是在商业世界你公开说'理想和追求',都成了有点'羞耻感'的东西,因为很少有人理解和相信,还会觉得你装X。'
但闫俊杰和MiniMax的实践正在改变这一现状。'看了闫俊杰和罗永浩这四个小时的交流,能感受到闫俊杰这几年的从思考到实践的闭环,正在打破了一种隐形的'理想主义羞耻感',不再把技术追求包裹到某个流行的、为了取悦投资人的商业故事里,而是写下一个自带生命力的、统一的新故事。'
在和老罗的采访中,闫俊杰将技术成功的关键总结为两个词:'一个是想象力,一个是自信。美国企业在自信方面做得很好,他们敢于讲我要引领这个行业。中国科技企业要更上一个层面,要引领世界,归根到底也需要坦荡的自信。'
这种自信源于对技术本质的深刻理解。'世界总有人会相信和支持你,管他是因为发自内心的认同,还是不明就里的FOMO。时代给了技术创业者伟大的机遇,如果本身所有投资人最终都要浪费95%的钱(这就是风险投资的本质),就让他们都浪费在'哥伦布'身上,这才更有意义。'
闫俊杰打了个样,展现了中国技术创业者在新时代的可能路径。保持纯粹的技术追求,同时建立全球化的视野与自信,这或许是新一代中国科技企业突破重围的关键。
结语:心舟飞渡万重山
闫俊杰的创业故事,是中国技术创业者在新AI时代的一个缩影。从商汤CTO到AI创业先锋,从技术极客到行业领导者,他的转变不仅是个人的成长,更代表了一代中国科技人的觉醒与蜕变。
在DeepSeek等国内技术突破的冲击下,闫俊杰没有选择退缩或改变路线,而是更加坚定地走在纯粹的技术追求之路上。这种'道路自信'的建立,源于对技术本质的深刻理解,也源于对中国科技企业独特优势的清醒认知。
'纯粹'是有意义的,把更高的技术追求和更大的商业价值结果变成一个统一逻辑,开始成为越来越符合时代和环境的技术创业路径。闫俊杰和MiniMax的实践证明,中国技术创业者完全可以打破'理想主义羞耻感',在商业世界中坦荡地追求技术理想。
正如文章标题所隐喻的,中国技术创业者的'心舟'正在飞渡AI的万重山。这条道路充满挑战,但也充满希望。闫俊杰的故事告诉我们,在这个全新的技术时代,保持纯粹、坚定自信,中国科技企业完全有可能在全球AI竞争中占据一席之地,甚至引领未来的发展方向。

图:AI技术发展历程中的关键突破点

