2014年,百度研究院来了个实习生,中科院自动化所的博士,河南县城出来的。他给自己算过一笔账:毕业后最理想的去处是IBM,写Java,年薪28万。
2026年春节,一款叫OpenClaw的Agent工具全球爆火,开发者搭龙虾需要底层大模型撑着。有个模型又快又便宜,一周在OpenRouter上吞掉1.44万亿Token,登顶全平台第一。
这个模型叫M2.5,公司叫MiniMax。
上市两个月,股价从165港元冲到1300港元,市值破3000亿,而它还是一家年收入不到8000万美元的公司。
做出MiniMax的人,就是十二年前那个实习生,闫俊杰。
提前一年多的赌注
2021年春节,闫俊杰回河南老家过年,去看了外公。
外公跟他说,想写一本回忆录,记录这80年的人生。但不会打字,也没办法把故事好好组织起来,说了几次,就搁下了。
闫俊杰在AI行业做了十多年。那一刻他突然意识到,他做的这些东西,哪怕已经在产业里落地,帮了多少企业,但对一个想写回忆录的老人来说,一点用都没有。
这个细节后来被反复引用,有点励志故事的味道。但它确实解释了一件事:他做AI的动机很朴素,让普通人真的能用上。这股执念,后来驱动了一系列反直觉的决策。
2021年底,他从商汤离职了。
时间点很关键。商汤当时正在准备港股上市,他是副总裁,研究院副院长,智慧城市事业群CTO,走的时候是公司最值钱的时候之一。他没等到上市,没等到财富兑现,就出来了。
ChatGPT是2022年11月才发布的。
MiniMax,2021年12月成立。
这个时间差,是后来一切的基础。闫俊杰后来自己说,要是做得早,在后来「明星研究员和大厂AI背景更受欢迎」的融资环境里,MiniMax根本打不过别人。
他父母都是普通人。高中在县城读,考上东南大学数学系,后来中科院自动化所读博,清华博士后,再进商汤,一步步走出来,没有任何海外背景,也没有什么显赫的人脉起点。
在百度实习那阵子,他和地平线的余凯有过交集。余凯后来说,学术能力可以训练,但能把AI技术工程化落地的人,凤毛麟角。闫俊杰是其中之一。
进商汤之后,他七年从实习生做到副总裁。2018年,在人手不够的情况下,他带队做出了一套「All for One」模型算法,在竞标里反超旷视和依图,拿到行业第一。有人评价他「看论文速度奇快,不管陈词滥调,只看精华要义」。这种效率,后来成了MiniMax的公司文化。
他给公司取名MiniMax,来自博弈论里冯·诺依曼的极小化极大算法。
他的解释是,做决策要先防住最坏的风险,再选相对最优解。
一张奇特的股东表
2021年12月,MiniMax完成天使轮,3100万美元,投前估值1.7亿美元。进来的有米哈游、IDG、高瓴、云启。
米哈游那笔钱有点特别。闫俊杰和米哈游董事长刘伟私交不错,天使轮就进来了,现在刘伟还在MiniMax的董事会里挂着非执行董事。
米哈游本身就是MiniMax的客户,游戏里的NPC对话、剧情生成,都在用他们的模型。
天使轮之后,故事遭遇了一个小插曲。
2023年3月,硅谷银行宣布破产。MiniMax当时所有资金都在那家银行。这是创业初期最险的一次,钱没了,融资环境还一片混乱。但他们撑过去了,两个月后拿到A轮2.57亿美元,估值11.57亿美元。
接下来的名单越来越夸张。阿里进来了,腾讯进来了,红杉跟了进去。到上市前,7轮融资,累计近15亿美元,估值42亿美元。IPO后阿里持股12.52%,是最大外部股东。
385人和1%的钱
MiniMax上市时,全公司385人,平均年龄29岁。
公司从成立到2025年9月,累计花费约5亿美元。OpenAI同期花了400亿到550亿美元。
这个对比有点荒谬。用不到对手1%的钱,做出了全模态全球领先的公司。省钱只是结果。真正的原因是他们把AI用到了极致。
公司80%的代码由AI完成,内部管AI叫「实习生」,这些实习生权限高到可以直接访问代码库、改线上环境,飞书里和它聊几句,review完直接上线。
这种效率让MiniMax的人均产出高到不正常。
产品层面,他们从一开始就走全模态路线:语言、视频、语音、音乐,四个方向同时压。别人都在学ChatGPT做对话,闫俊杰押的是多模态融合。他的判断是,多模态是持续提升智能的基本前提,不做全模态,下一代模型就没有机会。
现在的数字:2.36亿用户,覆盖200个国家和地区,海外收入占73%。B端21.4万企业客户和开发者,Google Vertex AI、微软Azure、AWS都已经部署了MiniMax的模型。
2月的ARR突破了1.5亿美元,M2系列单日Token消耗量是去年12月的6倍,其中编程方向增长超10倍。
大山不是不能翻越
2025年6月,MiniMax发布M1模型。
闫俊杰在朋友圈发了一句话:「第一次感觉到大山不是不能翻越。」
这句话背后的现实,中美头部模型技术能力可能只差5%,但这5%让海外公司占据了价值高出10倍的场景,收取高出10倍的价格,最终形成近百倍的商业化差距。
他做过一个判断,全球未来会有五家顶级AGI公司,其中至少两家来自中国,甚至有一家能做到第一。
MiniMax的故事不只是一家公司的故事。美国这几年在芯片上卡得越来越紧。A100限售,H100限售,H800也限售。逻辑很直接:掐住算力,就掐住了AI的喉咙。
中国这边被迫走了一条完全不同的路。DeepSeek用H800跑出了接近H100的效果。MiniMax用5亿美元干了OpenAI花几百亿才干到的事。
芯片封锁的本意是拉大差距,但实际效果是把中国AI公司逼进了一条低算力、高效率的进化路线。
钱少,卡少,人少,反而逼出了极致的工程能力和架构创新。
这跟华为做芯片的逻辑一样,你封锁我一项能力,我就在其他维度补回来,补的过程中,可能长出你没有的东西。
2014年那个在百度实习的河南博士生,大概不会想到,十二年后他站在的这个位置,背后连着的是一整场国运级别的技术竞争。
他选择继续跑下去。
来源:虎嗅

