小米 MiMo 降價 99%，國產大模型價格戰打到什麼階段了

5月27日，小米宣布MiMo-V2.5 Pro API永久降價，最高降幅99%，定價直接對標DeepSeek V4 Pro。幾乎是同一時間，智譜在2026年Q1完成了累計83%的漲價，CEO公開表態「漲價後仍供不應求，調用量增長400%」。一邊是接近底價的策略，另一邊是逆勢漲價還能翻倍成長。這背後是兩種截然不同的定價邏輯。國產大模型API 的定價已經從“按能力定價”轉向“按競爭定價”，這一輪集中降價背後的成本邏輯是什麼？在降價和未降價的模型之間，實際使用成本差距有多大，選型邏輯是否被改寫？

小米MiMo降價的真實力道：不只是「99%」這個數字

先拆解這次降價的核心事實。

根據小米MiMo官方公告，MiMo-V2.5系列API自5月27日起永久降價，最高降幅99%，同步取消上下文長度階梯計費，已購套餐額度全額重置。 MiMo-V2.5-TTS模型當前限時免費。

定價對標方面，開發者社群討論均指出：MiMo-V2.5 Pro定價與DeepSeek V4 Pro一致，MiMo-V2.5基礎版定價與DeepSeek V4 Flash一致。查閱DeepSeek官方API文件可知，DeepSeek V4 Pro輸入價格為3元/百萬Token，輸出價格為6元/百萬Token，緩存命中僅需0.025元/百萬Token。這意味著MiMo V2.5 Pro大機率也錨定這個價格體系。

「99%」這個數字需要理性看待。它指的是某些長上下文場景從舊價到新價的最高降幅，並非所有場景都打了一折。真正值得注意的訊號不是降幅百分比，而是降價方式：小米直接以DeepSeek為價格錨點，取消了先前按上下文視窗長度分檔收費的複雜計費規則。開發者不再需要為了省錢而手動截斷長文本，計費透明度的提升可能比單純降價更有實際價值。

小米這次定價對標，意味著它直接選擇與DeepSeek在同一價格帶上競爭。兩家都採用MoE架構（MiMo-V2.5總參數1.02T，啟動參數僅42B），都相容於OpenAI API格式，如今價格也完全對齊，開發者在兩者之間切換的成本幾乎為零。

降價陣營全景：誰在跟，背後是什麼邏輯

小米不是第一個降價的，也不會是最後一個。把降價陣營鋪開來看，共同特徵非常清晰。

DeepSeek是這一輪價格錨點的製定者。 5月31日，V4 Pro將結束持續一段時間的2.5折優惠，永久定價為原價的1/4，也就是前面提到的輸入3元、輸出6元。這不是臨時促銷，是長期定價。

位元組豆包的價格水準同樣壓得很低。根據GitHub LLM-Price價格追蹤專案數據，Doubao-Seed-2.0-Pro輸入3.2元/百萬Token，輸出16元/百萬Token。根據中國工業新聞網報道，字節豆包日均Token調用量已突破120萬億，是2024年5月的1000倍以上。

阿里通義千問是另一個大玩家。根據阿里雲發布的弗若斯特沙利文分析師報告，2025年下半年中國企業級市場大模型日均總消耗量為37兆Token，阿里千問佔比32.1%，排名第一。

降價派的共同特徵是背靠大廠生態。阿里的千問綁在阿里雲上，位元組的豆包是火山引擎的算力消耗入口，小米的MiMo則面向終端設備與開發者生態。對這些大廠而言，模型API本身不是利潤中心，它是一張獲客門票，真正的生意在後面的雲端運算、硬體銷售、廣告和終端生態裡。 API定價壓到邊際成本附近，只要能拉動更大的業務線成長，帳就算得過來。

但這裡有一個容易被忽略的問題：降價後各家對免費或低價套餐的並發QPS限制、SLA保障是否有隱性縮水，目前官方文件未做明確披露。企業採購做選型時，不能只看單價，還要看高並發場景下的可用性是否打了折扣。

漲價陣營的反邏輯：智譜和Kimi為什麼不降反漲

與降價派形成對照的，是智譜和月之暗面Kimi。

根據第一財經報道，智譜在2026年Q1 API價格累計上漲83%，CEO明確表示「漲價仍供不應求，呼叫量增加400%」。 Kimi的Moonshot V1模型目前定價為輸入10元/百萬Token、輸出30元/百萬Token，是DeepSeek/MiMo同類產品的3到4倍。

漲價不是憑空喊價。 OpenRouter的數據指出，2026年2月中國AI模型調用量首次超過美國，前五名中有四款中國模型，其中智譜和Kimi均在其列。智譜GLM-5系列在複雜Agent和程式碼產生場景下表現突出，Kimi K2.5則靠著長上下文和推理能力支撐自己的高定價。

這裡有一個不常識的商業邏輯：Agent時代，單價最低不等於綜合成本最低。複雜任務情境下，模型的一次成功率直接決定總Token消耗。一個單價高但一次就能輸出正確程式碼的模型，和一個單價低但需要反覆糾錯、重試三五次的模型相比，最終的實際消耗可能更少。智譜“漲價仍供不應求”，根源之一就在於企業客戶在算總帳之後發現，高價模型的綜合成本反而更低。

不過要說明，智譜GLM-5在當前具體場景下相比DeepSeek或MiMo的真實成功率和Token消耗差異，在沒有獨立第三方評測數據支持的情況下，不宜做確定性結論。企業選型時應該在自己的實際任務上做A/B測試，而不是依賴Benchmark排名或廠商宣傳做決策。

成本差距量化：1元的購買力差了4倍

現在把降價派和未降價派拉到同一個量綱下，做一個直覺的成本比較。

以100萬輸入Token加100萬輸出Token為基礎任務單元：

DeepSeek V4 Pro / 小米MiMo V2.5 Pro ：輸入3元加輸出6元，綜合成本約9元。
位元組豆包Seed-2.0-Pro ：輸入3.2元加輸出16元，綜合成本約19.2元。
Kimi Moonshot V1 ：輸入10元加輸出30元，綜合成本約40元。

最低檔和最高檔之間的差距是4.4倍。處理同樣Token量的任務，用Kimi的成本接近用DeepSeek或MiMo的4倍。如果加上上下文越長消耗越大的實際情況，這個差距在長文字場景下會拉得更大。

這裡對比的僅限於基礎模型API的公開輸入輸出定價。通義千問Qwen3-Max輸出價格未查到（僅查到輸入8.81元/百萬Token），智譜GLM-5具體單價也因漲價後尚未更新至公開管道而缺失。這兩家的數據有待補充。

對於翻譯、摘要、簡單問答這類“體力活”，4倍以上的成本差距意味著選低價模型幾乎沒有猶豫空間。但對於多輪複雜Agent調用、長代碼生成、長程推理這類“腦力活”，單價比對不能作為唯一決策依據。 OmniTools的建議是：企業內部做一個任務分類，把高頻簡單任務和低頻複雜任務分開選型，而不是用一個模型覆蓋所有場景。

開發者的遷移成本與新的選用邏輯

降價之後，該不該換模型？這個問題對不同開發者來說，答案完全不同。

對於基礎場景的開發者，遷移成本很低。 DeepSeek和小米MiMo都相容於OpenAI API格式，只需要修改程式碼中的model參數和Base URL即可完成切換。社群已有開發者回饋基本就是改兩行程式碼的事。小米取消上下文長度階梯計費後，開發者不需要再為長文本場景單獨做成本優化，程式碼邏輯可以更簡潔。

對於深度綁定特定模型高階能力的應用，情況就不一樣了。如果產品重度依賴Kimi的長上下文視窗、智譜GLM-5的特定Agent工具呼叫格式、或某個模型的獨特輸出風格，遷移成本遠不止改兩行程式碼——可能需要重新設計提示詞、重新調試函數呼叫鏈、重新處理邊界情況。這個成本不是API單價能涵蓋的。

這正是市場正在發生的自然分層：通用任務卷價格，複雜任務卷能力。兩套賽道會同時存在，而且各自都有足夠的市場空間。智譜漲價83%還能成長400%調用量，DeepSeek降價到3元還能持續運營，這本身就說明了兩套邏輯可以並行不悖。

對企業採購決策者來說，可以建立多模型路由機制：高頻、低複雜度任務走低價模型，降低基礎成本；低頻、高難度任務走高價高能模型，確保任務成功率。兩者結合，才是當前成本最優解。

這輪定價分化的本質：從“技術溢價”到“生態補貼”

最後來回答那個核心問題：為什麼一邊在狂降、一邊在狂漲？

小米官方給出的解釋是“全端推理優化與服務效率提升”，技術細節承諾將透過後續技術部落格披露。從已知架構資訊來看，MiMo-V2.5採用MoE架構，總參數1.02T中僅42B激活，確實在推理效率上有結構性優勢。 DeepSeek同樣以MoE架構著稱，推理成本本身就比同等能力的Dense模型低一個數量級。

但技術降本不是充分條件。更深層的原因是產業結構的差異。

大廠陣營阿里、位元組、小米的模型API本質上是更大商業版圖的獲客入口。阿里用千問綁阿里雲，位元組用豆包拉火山引擎，小米用MiMo鋪終端和開發者生態。 API可以不賺錢，甚至可以接受長期微虧，只要能帶來雲端服務訂閱、算力消耗、硬體出貨、廣告收入等更大盤的收益。這是一種「生態補貼」邏輯：大廠內部有其他利潤中心來為低價API買單。

新創公司陣營智譜、Kimi沒有這個補助池。他們必須靠API本身的收入來涵蓋研發和算力成本，必須追求正向的商業化利潤。在Agent時代Token消耗指數級成長的大背景下，維持低價意味著賣得越多虧越多，漲價反而是一種理性的商業選擇。

這個結構性差異短期內不會彌合。大廠不會在API上追求獲利，新創公司也不可能燒錢陪跑到底。兩套定價邏輯會長期共存，市場最終會形成雙軌制的穩定格局。

對於開發者和企業客戶來說，這其實是個好消息。你可以用最低的成本完成大部分基礎工作，同時也有足夠強的模型來處理那些真正需要「智力」的複雜任務。關鍵不在於選誰，而是知道什麼時候該用誰。