MiniMax:一個河南縣城青年和他的3000億

  • 創辦人閆俊傑背景:2014年百度實習生,中科院博士,2021年創立MiniMax,早於ChatGPT發布。
  • 公司發展:從商湯離職後成立,專注全模態AI,2024年發布國內首個MoE大模型。
  • 高效運營:僅385人,累計花費5億美元,80%代碼由AI完成,人均產出高。
  • 市場表現:全球2.36億用戶,海外收入佔73%,但C端毛利率低(約2.1%)。
  • 融資與股東:天使輪獲米哈遊等投資,A輪後阿里、騰訊加入,阿里為最大外部股東。
  • 技術決策:提前押注MoE,實現低成本高效果,模型如M2.5在OpenRouter登頂。
  • 未來挑戰:致力從大模型公司轉型AI平台,面臨全球競爭,展示中國AI創新。
總結

作者: 林晚晚,律動

2014 年,百度研究院來了個實習生,中科院自動化所的博士,河南縣城出來的。他給自己算過一筆帳:畢業後最理想的去處是IBM,寫Java,年薪28 萬。

2026 年春節,一款叫OpenClaw 的Agent 工俱全球爆火,開發者搭龍蝦需要底層大模型撐著。有個模型又快又便宜,一週在OpenRouter 上吞掉1.44 兆Token,登頂全平台第一。

這個模型叫M2.5,公司叫MiniMax。

上市兩個月,股價從165 港元衝到1,300 港元,市值破3,000 億,而它還是一家年收入不到8,000 萬美元的公司。

做出MiniMax 的人,就是十二年前那個實習生,髕俊傑。

提前一年多的賭注

2021 年春節,閔俊傑回河南老家過年,去看了外公。

外公跟他說,想寫一本回憶錄,記錄這80 年的人生。但不會打字,也沒辦法把故事好好整理起來,說了幾次,就擱下了。

閔俊傑在AI 產業做了十多年。那一刻他突然意識到,他做的這些東西,就算已經在產業裡落地,幫了多少企業,但對一個想寫回憶錄的老人來說,一點用都沒有。

這個細節後來被反覆引用,有點勵志故事的味道。但它確實解釋了一件事:他做AI 的動機很樸素,讓普通人真的能用上。這股執念,後來驅動了一系列反直覺的決策。

2021 年底,他從商湯離職了。

時間點很關鍵。商湯當時正在準備港股上市,他是副總裁,研究院副院長,智慧城市事業群CTO,走的時候是公司最值錢的時候之一。他沒等到上市,沒等到財富兌現,就出來了。

ChatGPT 是2022 年11 月才發布的。

MiniMax,2021 年12 月成立。

這個時間差,是後來一切的基礎。閔俊傑後來自己說,要不是做得早,在後來「明星研究員和大廠AI 背景更受歡迎」的融資環境裡,MiniMax 根本打不過別人。

他父母都是普通人。高中在縣城讀,考上東南大學數學系,後來中科院自動化所讀博,清華博士後,再進商湯,一步步走出來,沒有任何海外背景,也沒有什麼顯赫的人脈起點。

在百度實習那陣子,他和地平線的餘凱有過交集。餘凱後來說,學術能力可以訓練,但能把AI 技術工程化落地的人,鳳毛麟角。閔俊傑就是其中之一。

進商湯之後,他七年從實習生做到副總裁。 2018 年,在人手不夠的情況下,他帶領團隊做出了一套「All for One」模型演算法,在競標裡反超曠視和依圖,拿到業界第一。有人評價他「看論文速度奇快,不管陳腔濫調,只看精華要義」。這種效率,後來成了MiniMax 的公司文化。

他為公司取名為MiniMax,來自博弈論裡馮·諾依曼的極小化極大演算法。

他的解釋是,做決策要先防住最壞的風險,再選相對最優解。

一張奇特的股東表

2021 年12 月,MiniMax 完成天使輪,3,100 萬美元,投前估值1.7 億美元。進來的有米哈遊、IDG、高瓴、雲啟。

米哈遊那筆錢有點特別。閔俊傑和米哈遊董事長劉偉私交不錯,天使輪就進來了,現在劉偉還在MiniMax 的董事會裡掛著非執行董事。

米哈遊本身就是MiniMax 的客戶,遊戲裡的NPC 對話、劇情生成,都在用他們的模型。

天使輪之後,故事遭遇了一個小插曲。

2023 年3 月,矽谷銀行宣布破產。 MiniMax 當時所有資金都在那家銀行。這是創業初期最險的一次,錢沒了,融資環境還一片混亂。但他們撐過去了,兩個月後拿到A 輪2.57 億美元,估值11.57 億美元。

接下來的名單越來越誇張。阿里進來了,騰訊進來了,紅杉跟了進去。到上市前,7 輪融資,累計近15 億美元,估值42 億美元。 IPO 後阿里持股12.52%,為最大外部股東。

閔俊傑早期融資有個習慣:只和投資機構的最高位談。他見了紅杉的沈南鵬,見了高瓴的張磊。

但這張股東表上還有一個人值得單獨講:贠燁禕。

1994 年生,約翰霍普金斯大學電子工程本科,輔修經濟學和數學。 2017 年本科一畢業就進商湯,幹的是融資與策略投資,一年後升任CEO 徐立的行政助理兼策略部總監。她深度參與了商湯從早期到港股上市的整個過程。

2021 年,她和閔俊傑一起出來創業。

有投資人評價她「幹練、有氣場、執行力強,有種超出其年齡的成熟」。她和閔俊傑的分工很清楚:一個定義技術願景,一個把願景變成金錢和資源。閔俊傑能鑽進技術裡,頭髮都剃光了也無所謂,但市場、資本、全球化,是贠燁禕的戰場。

上市敲鐘那天,兩個人站在同一個台子上。贠燁禕31 歲,身價超過40 億港元。

385 人和1% 的錢

MiniMax 上市時,全公司385 人,平均年齡29 歲。

公司從成立到2025 年9 月,累計花費約5 億美元。 OpenAI 同期花了400 億到550 億美元。

這個對比有點荒謬。用不到對手1% 的錢,做出了全模態全球領先的公司。省錢只是結果。真正的原因是他們把AI 用到了極致。公司80% 的程式碼由AI 完成,內部管AI 叫「實習生」,這些實習生權限高到可以直接存取程式碼庫、改線上環境,飛書里和它聊幾句,review 完直接上線。

這種效率讓MiniMax 的人均產出高到不正常。

產品層面,他們從一開始就走全模態路線:語言、視訊、語音、音樂,四個方向同時壓。別人都在學ChatGPT 做對話,髕俊傑押的是多模態融合。他的判斷是,多模態是持續提升智慧的基本前提,不做全模態,下一代模型就沒有機會。

2023 年夏天,他做了一個更激進的決定。

把80% 的算力和研發資源,全部壓到MoE(混合專家系統)。

那時候,國內主流還在迭代稠密模型,MoE 被認為是「前沿但不成熟」的技術。閔俊傑的邏輯很簡單:如果要服務千萬、億級用戶,產生token 的成本和延遲,用稠密模型根本撐不住。不做MoE,規模上不去,一切都是白搭。

2024 年初,MiniMax 發布了國內首個MoE 大模型。

產品上,他們也沒有去捲國內市場。 C 端做了星野和Talkie,一個在國內,一個在海外,做AI 陪伴;海螺AI 做視頻生成,2024 年下半年連續半年全球視頻生成應用月活第一。

現在的數字:2.36 億用戶,覆蓋200 個國家和地區,海外收入佔73%。 B 端21.4 萬企業客戶和開發者,Google Vertex AI、微軟Azure、AWS 都已經部署了MiniMax 的模型,Notion 首個開源模型選擇,也是MiniMax。

2 月的ARR 突破了1.5 億美元,M2 系列單日Token 消耗量是去年12 月的6 倍,程式方向成長超10 倍。

這才是市場願意給200 倍市銷率的原因。

但有一組數字要拆開看。

年報裡,C 端毛利率4.7%,B 端毛利率69.4%。公司67% 的營收來自C 端,但C 端幾乎不貢獻毛利。第四季粗算下來,C 端毛利率已經跌到約2.1%。整體毛利率從12.2% 提升到25.4%,主要是因為B 端營收比例在第四季快速拉升,把整體數字拖上來了。

這是一道沒解完的題。

大山不是不能翻越

2025 年6 月,MiniMax 發表M1 模型。

髕俊傑在朋友圈發了一句話:

「第一次感覺到大山不是不能翻越。」

這句話背後的現實,中美頭部模型技術能力可能只差5%,但這5% 讓海外公司佔據了價值高出10 倍的場景,收取高出10 倍的價格,最終形成近百倍的商業化差距。 OpenAI 最新估值超過7000 億美元。 MiniMax 上市市值800 億港元,不到100 億美元。

他做過一個判斷,全球未來會有五家頂尖AGI 公司,其中至少兩家來自中國,甚至有一家能做到第一。

1 月9 日上市之後,他緊接著在1 月19 日出現在總理主持的專家企業家座談會上,成為繼DeepSeek 梁文鋒之後第二位參加的AI 大模型創始人。

然後3 月2 日,首份年報出來,港股當天大漲。

在財報會上,閔俊傑花了很長時間講一件事:MiniMax 要從「大模型公司」變成「AI 時代的平台型公司」。

他為平台價值下了一個公式:智慧密度× Token 吞吐。網路時代的平台是流量入口,AI 時代的平台是能定義智慧邊界、同時在商業上吃到紅利的公司。 Google 在做,OpenAI 在做,他們也要做。

他面對的對手,體積是他的幾十倍。

港股上市只是把他推到了另一個戰場。季報、分析師、市值壓力,這些東西和寫程式完全不是一回事。二級市場不相信情懷,只看數字。 C 端的故事能不能轉化成毛利,B 端的增速能不能維持,M3 什麼時候出來,這些問題,接下來每季都要回答。

但把視角拉遠一點看,MiniMax 的故事不只是一家公司的故事。

美國這幾年在晶片上卡得越來越緊。 A100 限售,H100 限售,H800 也限售。邏輯很直接:掐住算力,就掐住了AI 的喉嚨。

中國這邊被迫走了一條完全不同的路。

DeepSeek 用H800 跑出了接近H100 的效果。 MiniMax 用5 億美元做了OpenAI 花幾百億才幹到的事。閔俊傑2023 年賭MoE,原因是手上那點卡根本撐不起億級用戶的推理量。 M2.5 連續工作一小時1 美元,是GPT-5 的二十分之一。混合注意力架構、線性注意力、CISPO 演算法,創新都是被逼出來的。

晶片封鎖的本意是拉大差距,但實際效果是把中國AI 公司逼進了一條低算力、高效率的進化路線。

錢少,卡少,人少,反而逼出了極致的工程能力和架構創新。

這跟華為做晶片的邏輯一樣,你封鎖我一項能力,我就在其他維度補回來,補的過程中,可能長出你沒有的東西。

OpenAI 現在4000 多人,2025 年燒了80 億美元現金,到2030 年計劃砸6000 億美元的算力。 MiniMax 385 人,累計花了5 億美元。

誰贏還不知道。但至少現在,賭MiniMax 會死的人越來越少了。

2014 年那個在百度實習的河南博士生,大概不會想到,十二年後他站在的這個位置,背後連著的是一整場國運級別的技術競爭。

他選擇繼續跑下去。

分享至:

作者:区块律动BlockBeats

本文為PANews入駐專欄作者的觀點,不代表PANews立場,不承擔法律責任。

文章及觀點也不構成投資意見

圖片來源:区块律动BlockBeats如有侵權,請聯絡作者刪除。

關注PANews官方賬號,一起穿越牛熊