小米 MiMo 降價 99%,國產大模型價格戰打到什麼階段了

  • 小米MiMo-V2.5 Pro降價最高99%,直接對標DeepSeek V4 Pro,同時取消上下文長度階梯計費,簡化開發者成本優化。
  • 降價派(阿里、字節、小米)均背靠大廠生態,將API視為獲客入口,依靠生態補貼壓低價格,推動通用任務成本接近邊際。
  • 漲價派(智譜、Kimi)憑藉複雜任務下更高的成功率和更優的綜合成本實現逆勢漲價,智譜Q1漲價83%後調用量仍增長400%。
  • 成本量化:處理百萬輸入+百萬輸出Token,DeepSeek/MiMo約9元,字節豆包約19.2元,Kimi約40元,高低價差達4.4倍。
  • 選型建議:簡單任務優先使用低價模型,複雜Agent/程式碼生成等選用高價高能模型,企業內部宜採用多模型路由。
  • 定價分化本質:大廠生態補貼 vs 創業公司追求正向利潤,雙軌制將長期共存。
總結

5月27日,小米宣布MiMo-V2.5 Pro API永久降價,最高降幅99%,定價直接對標DeepSeek V4 Pro。幾乎是同一時間,智譜在2026年Q1完成了累計83%的漲價,CEO公開表態「漲價後仍供不應求,調用量增長400%」。一邊是接近底價的策略,另一邊是逆勢漲價還能翻倍成長。這背後是兩種截然不同的定價邏輯。國產大模型API 的定價已經從“按能力定價”轉向“按競爭定價”,這一輪集中降價背後的成本邏輯是什麼?在降價和未降價的模型之間,實際使用成本差距有多大,選型邏輯是否被改寫?

小米MiMo降價的真實力道:不只是「99%」這個數字

先拆解這次降價的核心事實。

根據小米MiMo官方公告,MiMo-V2.5系列API自5月27日起永久降價,最高降幅99%,同步取消上下文長度階梯計費,已購套餐額度全額重置。 MiMo-V2.5-TTS模型當前限時免費。

定價對標方面,開發者社群討論均指出:MiMo-V2.5 Pro定價與DeepSeek V4 Pro一致,MiMo-V2.5基礎版定價與DeepSeek V4 Flash一致。查閱DeepSeek官方API文件可知,DeepSeek V4 Pro輸入價格為3元/百萬Token,輸出價格為6元/百萬Token,緩存命中僅需0.025元/百萬Token。這意味著MiMo V2.5 Pro大機率也錨定這個價格體系。

「99%」這個數字需要理性看待。它指的是某些長上下文場景從舊價到新價的最高降幅,並非所有場景都打了一折。真正值得注意的訊號不是降幅百分比,而是降價方式:小米直接以DeepSeek為價格錨點,取消了先前按上下文視窗長度分檔收費的複雜計費規則。開發者不再需要為了省錢而手動截斷長文本,計費透明度的提升可能比單純降價更有實際價值。

小米這次定價對標,意味著它直接選擇與DeepSeek在同一價格帶上競爭。兩家都採用MoE架構(MiMo-V2.5總參數1.02T,啟動參數僅42B),都相容於OpenAI API格式,如今價格也完全對齊,開發者在兩者之間切換的成本幾乎為零。

降價陣營全景:誰在跟,背後是什麼邏輯

小米不是第一個降價的,也不會是最後一個。把降價陣營鋪開來看,共同特徵非常清晰。

DeepSeek是這一輪價格錨點的製定者。 5月31日,V4 Pro將結束持續一段時間的2.5折優惠,永久定價為原價的1/4,也就是前面提到的輸入3元、輸出6元。這不是臨時促銷,是長期定價。

位元組豆包的價格水準同樣壓得很低。根據GitHub LLM-Price價格追蹤專案數據,Doubao-Seed-2.0-Pro輸入3.2元/百萬Token,輸出16元/百萬Token。根據中國工業新聞網報道,字節豆包日均Token調用量已突破120萬億,是2024年5月的1000倍以上。

阿里通義千問是另一個大玩家。根據阿里雲發布的弗若斯特沙利文分析師報告,2025年下半年中國企業級市場大模型日均總消耗量為37兆Token,阿里千問佔比32.1%,排名第一。

降價派的共同特徵是背靠大廠生態。阿里的千問綁在阿里雲上,位元組的豆包是火山引擎的算力消耗入口,小米的MiMo則面向終端設備與開發者生態。對這些大廠而言,模型API本身不是利潤中心,它是一張獲客門票,真正的生意在後面的雲端運算、硬體銷售、廣告和終端生態裡。 API定價壓到邊際成本附近,只要能拉動更大的業務線成長,帳就算得過來。

但這裡有一個容易被忽略的問題:降價後各家對免費或低價套餐的並發QPS限制、SLA保障是否有隱性縮水,目前官方文件未做明確披露。企業採購做選型時,不能只看單價,還要看高並發場景下的可用性是否打了折扣。

漲價陣營的反邏輯:智譜和Kimi為什麼不降反漲

與降價派形成對照的,是智譜和月之暗面Kimi。

根據第一財經報道,智譜在2026年Q1 API價格累計上漲83%,CEO明確表示「漲價仍供不應求,呼叫量增加400%」。 Kimi的Moonshot V1模型目前定價為輸入10元/百萬Token、輸出30元/百萬Token,是DeepSeek/MiMo同類產品的3到4倍。

漲價不是憑空喊價。 OpenRouter的數據指出,2026年2月中國AI模型調用量首次超過美國,前五名中有四款中國模型,其中智譜和Kimi均在其列。智譜GLM-5系列在複雜Agent和程式碼產生場景下表現突出,Kimi K2.5則靠著長上下文和推理能力支撐自己的高定價。

這裡有一個不常識的商業邏輯:Agent時代,單價最低不等於綜合成本最低。複雜任務情境下,模型的一次成功率直接決定總Token消耗。一個單價高但一次就能輸出正確程式碼的模型,和一個單價低但需要反覆糾錯、重試三五次的模型相比,最終的實際消耗可能更少。智譜“漲價仍供不應求”,根源之一就在於企業客戶在算總帳之後發現,高價模型的綜合成本反而更低。

不過要說明,智譜GLM-5在當前具體場景下相比DeepSeek或MiMo的真實成功率和Token消耗差異,在沒有獨立第三方評測數據支持的情況下,不宜做確定性結論。企業選型時應該在自己的實際任務上做A/B測試,而不是依賴Benchmark排名或廠商宣傳做決策。

成本差距量化:1元的購買力差了4倍

現在把降價派和未降價派拉到同一個量綱下,做一個直覺的成本比較。

以100萬輸入Token加100萬輸出Token為基礎任務單元:

  • DeepSeek V4 Pro / 小米MiMo V2.5 Pro :輸入3元加輸出6元,綜合成本約9元。
  • 位元組豆包Seed-2.0-Pro :輸入3.2元加輸出16元,綜合成本約19.2元。
  • Kimi Moonshot V1 :輸入10元加輸出30元,綜合成本約40元。

最低檔和最高檔之間的差距是4.4倍。處理同樣Token量的任務,用Kimi的成本接近用DeepSeek或MiMo的4倍。如果加上上下文越長消耗越大的實際情況,這個差距在長文字場景下會拉得更大。

這裡對比的僅限於基礎模型API的公開輸入輸出定價。通義千問Qwen3-Max輸出價格未查到(僅查到輸入8.81元/百萬Token),智譜GLM-5具體單價也因漲價後尚未更新至公開管道而缺失。這兩家的數據有待補充。

對於翻譯、摘要、簡單問答這類“體力活”,4倍以上的成本差距意味著選低價模型幾乎沒有猶豫空間。但對於多輪複雜Agent調用、長代碼生成、長程推理這類“腦力活”,單價比對不能作為唯一決策依據。 OmniTools的建議是:企業內部做一個任務分類,把高頻簡單任務和低頻複雜任務分開選型,而不是用一個模型覆蓋所有場景。

開發者的遷移成本與新的選用邏輯

降價之後,該不該換模型?這個問題對不同開發者來說,答案完全不同。

對於基礎場景的開發者,遷移成本很低。 DeepSeek和小米MiMo都相容於OpenAI API格式,只需要修改程式碼中的model參數和Base URL即可完成切換。社群已有開發者回饋基本就是改兩行程式碼的事。小米取消上下文長度階梯計費後,開發者不需要再為長文本場景單獨做成本優化,程式碼邏輯可以更簡潔。

對於深度綁定特定模型高階能力的應用,情況就不一樣了。如果產品重度依賴Kimi的長上下文視窗、智譜GLM-5的特定Agent工具呼叫格式、或某個模型的獨特輸出風格,遷移成本遠不止改兩行程式碼——可能需要重新設計提示詞、重新調試函數呼叫鏈、重新處理邊界情況。這個成本不是API單價能涵蓋的。

這正是市場正在發生的自然分層:通用任務卷價格,複雜任務卷能力。兩套賽道會同時存在,而且各自都有足夠的市場空間。智譜漲價83%還能成長400%調用量,DeepSeek降價到3元還能持續運營,這本身就說明了兩套邏輯可以並行不悖。

對企業採購決策者來說,可以建立多模型路由機制:高頻、低複雜度任務走低價模型,降低基礎成本;低頻、高難度任務走高價高能模型,確保任務成功率。兩者結合,才是當前成本最優解。

這輪定價分化的本質:從“技術溢價”到“生態補貼”

最後來回答那個核心問題:為什麼一邊在狂降、一邊在狂漲?

小米官方給出的解釋是“全端推理優化與服務效率提升”,技術細節承諾將透過後續技術部落格披露。從已知架構資訊來看,MiMo-V2.5採用MoE架構,總參數1.02T中僅42B激活,確實在推理效率上有結構性優勢。 DeepSeek同樣以MoE架構著稱,推理成本本身就比同等能力的Dense模型低一個數量級。

但技術降本不是充分條件。更深層的原因是產業結構的差異。

大廠陣營阿里、位元組、小米的模型API本質上是更大商業版圖的獲客入口。阿里用千問綁阿里雲,位元組用豆包拉火山引擎,小米用MiMo鋪終端和開發者生態。 API可以不賺錢,甚至可以接受長期微虧,只要能帶來雲端服務訂閱、算力消耗、硬體出貨、廣告收入等更大盤的收益。這是一種「生態補貼」邏輯:大廠內部有其他利潤中心來為低價API買單。

新創公司陣營智譜、Kimi沒有這個補助池。他們必須靠API本身的收入來涵蓋研發和算力成本,必須追求正向的商業化利潤。在Agent時代Token消耗指數級成長的大背景下,維持低價意味著賣得越多虧越多,漲價反而是一種理性的商業選擇。

這個結構性差異短期內不會彌合。大廠不會在API上追求獲利,新創公司也不可能燒錢陪跑到底。兩套定價邏輯會長期共存,市場最終會形成雙軌制的穩定格局。

對於開發者和企業客戶來說,這其實是個好消息。你可以用最低的成本完成大部分基礎工作,同時也有足夠強的模型來處理那些真正需要「智力」的複雜任務。關鍵不在於選誰,而是知道什麼時候該用誰。

分享至:

作者:OmniTools

本文為PANews入駐專欄作者的觀點,不代表PANews立場,不承擔法律責任。

文章及觀點也不構成投資意見

圖片來源:OmniTools如有侵權,請聯絡作者刪除。

關注PANews官方賬號,一起穿越牛熊
PANews APP
某聰明交易者買進7000枚ETH存入Aave,此前ETH波段累計獲利204萬美元
PANews 快訊