5月27日、XiaomiはMiMo-V2.5 Pro APIの恒久的な値下げを発表し、最大99%の値下げを実施、DeepSeek V4 Proを直接的にターゲットにした。ほぼ同時に、Zhipuは2026年第1四半期に累計83%の値上げを完了し、CEOは「値上げにもかかわらず、供給は依然として需要を満たしておらず、通話量は400%増加した」と公言した。一方はほぼ底値での価格設定戦略、もう一方はトレンドに逆行して値上げしながらも二桁成長を達成する戦略である。これら二つの背後には全く異なる価格設定ロジックが存在する。国内の大規模モデルAPIの価格設定は「機能に基づく価格設定」から「競争に基づく価格設定」へと移行した。今回の集中的な値下げの背後にあるコストロジックとは何なのか?値下げされたモデルと値下げされていないモデルの実際のコスト差はどれくらいなのか?選択ロジックは書き換えられたのか?
Xiaomi MiMoの価格引き下げの真の規模は、「99%」という数字だけではありません。
この値下げの核心となる事実を詳しく見ていきましょう。
Xiaomi MiMoの公式発表によると、MiMo-V2.5シリーズのAPIは5月27日から恒久的に割引され、最大99%の割引が適用されます。コンテキスト長に基づく段階課金は廃止され、既存のサブスクリプション制限は完全にリセットされます。MiMo-V2.5-TTSモデルは現在、期間限定で無料です。
価格設定の基準に関して、開発者コミュニティ内での議論では、MiMo-V2.5 ProはDeepSeek V4 Proと同価格、MiMo-V2.5の基本バージョンはDeepSeek V4 Flashと同価格であると一貫して示されています。DeepSeekの公式APIドキュメントを参照すると、DeepSeek V4 Proの入力価格は100万トークンあたり3元、出力価格は100万トークンあたり6元、キャッシュヒットコストは100万トークンあたりわずか0.025元であることがわかります。このことから、MiMo V2.5 Proもこの価格帯に収まる可能性が高いと考えられます。
「99%」という数字は、合理的に解釈する必要があります。これは、特定の長いコンテキストのシナリオにおける旧価格から新価格への最大割引率を指しており、すべてのシナリオで90%割引になるという意味ではありません。本当に注目すべき点は、割引率そのものではなく、価格削減の方法にあります。XiaomiはDeepSeekを価格基準として直接使用することで、コンテキストウィンドウの長さに基づいて料金を段階的に設定していた従来の複雑な課金ルールを廃止しました。開発者は、コスト削減のために長いテキストを手動で切り詰める必要がなくなり、この課金の透明性の向上は、単なる価格削減よりも価値があると言えるでしょう。
Xiaomiの価格戦略はDeepSeekを直接的にターゲットにしており、同じ価格帯に位置付けている。両社ともMoEアーキテクチャ(総パラメータ1.02T、アクティベーションパラメータわずか42BのMiMo-V2.5)を採用し、OpenAI APIフォーマットと互換性があり、価格も完全に一致しているため、開発者は事実上コストをかけずに両社を切り替えることができる。
価格引き下げ陣営の全体像:追随しているのは誰か、そしてその根底にある論理とは何か?
価格を引き下げたのはシャオミが最初ではないし、最後でもないだろう。価格を引き下げている企業群全体を見渡すと、非常に明確な共通点が見えてくる。
DeepSeekは今回の価格設定を決定しました。5月31日をもって、V4 Proの25%割引は終了し、価格は元の価格の4分の1、つまり入力3元、出力6元となります。これは一時的なプロモーションではなく、長期的な価格設定です。
ByteDanceのDoubaoの価格も非常に低く抑えられています。GitHubのLLM-Price価格追跡プロジェクトのデータによると、Doubao-Seed-2.0-Proは100万トークンあたり3.2元を投入し、100万トークンあたり16元を出力します。中国工業新聞網によると、ByteDanceの1日のトークン使用量は120兆を超え、2024年5月の1000倍以上となっています。
アリババクラウドの同義千文も主要なプレーヤーの一つです。アリババクラウドが発表したフロスト&サリバンのアナリストレポートによると、2025年下半期における中国の大規模企業向けトークンの1日平均総消費量は37兆トークンとなり、アリババ千文が32.1%を占めて首位になると予測されています。
価格引き下げを目指す企業に共通する特徴は、大手企業のエコシステムに支えられている点です。アリババのQianwenはアリババクラウドと連携しており、バイトダンスのDoubaoはVolcano Engineのコンピューティングパワー消費の入り口であり、シャオミのMiMoは端末機器と開発者エコシステムをターゲットにしています。これらの大手企業にとって、API自体は利益を生み出すものではなく、顧客獲得のための手段です。真のビジネスは、その後のクラウドコンピューティング、ハードウェア販売、広告、そして端末エコシステムにあります。APIの価格を限界費用に近い水準に設定することは、より大きなビジネスラインの成長を促進する限り、利益につながります。
しかし、見落としがちな問題があります。価格が引き下げられた後、無料または低価格のパッケージでは、同時接続QPS制限やSLA保証が隠れて引き下げられることはありません。公式ドキュメントにはこの点が明示的に記載されていません。企業は選択を行う際に、単価だけを見るのではなく、高同時接続シナリオにおける可用性が損なわれていないかどうかも考慮する必要があります。
価格高騰の背後にある、直感に反する理由:ZhipuとKimiはなぜ価格を下げるのではなく、値上げしたのか?
価格競争派とは対照的に、ZhipuとMoonのDark Side Kimiは、価格競争派の代表格と言えるでしょう。
CBNによると、ZhipuのAPI価格は2026年第1四半期に累計で83%上昇し、CEOは「価格上昇にもかかわらず、供給は依然として需要を満たしておらず、呼び出し量は400%増加している」と明言した。KimiのMoonshot V1モデルは現在、入力が100万トークンあたり10元、出力が100万トークンあたり30元で、DeepSeek/MiMoの同様の製品の3~4倍となっている。
価格上昇は恣意的なものではありません。OpenRouterのデータによると、2026年2月には中国で呼び出されたAIモデルの数が初めて米国を上回り、上位5つのうち4つがZhipuとKimiを含む中国製モデルでした。ZhipuのGLM-5シリーズは複雑なエージェント生成やコード生成のシナリオで優れた性能を発揮し、Kimi K2.5の高価格は、その長いコンテキストと推論能力によって正当化されます。
直感に反するビジネスロジックをご紹介しましょう。エージェント時代においては、単価が最も低いことが必ずしも総コストが最も低いことを意味するわけではありません。複雑なタスクシナリオでは、モデルの成功率がトークンの総消費量を直接決定します。単価が高くても初回で正しいコードを出力するモデルは、単価が低くてもデバッグと3~5回の再試行が必要なモデルに比べて、最終的に消費するトークンが少なくなる可能性があります。Zhipuの「価格上昇が依然として供給不足につながる」理由の一つは、企業顧客が総コストを計算した結果、高価格モデルの方が実際には総コストが低いことに気づくからです。
ただし、独立した第三者機関による評価データがない限り、特定のシナリオにおけるGLM-5とDeepSeekまたはMiMoの実際の成功率やトークン消費量の違いについて決定的な結論を出すのは時期尚早であることに留意すべきです。企業は、ベンチマークランキングやベンダーのマーケティング上の主張に頼るのではなく、ソリューションを選択する際には、実際のタスクでA/Bテストを実施する必要があります。
コスト差を定量化すると、1元の購買力は4倍異なる。
それでは、価格を引き下げた企業と引き下げなかった企業を同じ土俵に立たせ、直接的なコスト比較をしてみましょう。
基本的なタスク単位は、100万個の入力トークンと100万個の出力トークンで構成されます。
- DeepSeek V4 Pro / Xiaomi MiMo V2.5 Pro :入力コストは3元、出力コストは6元で、合計コストは約9元です。
- ByteDance Seed-2.0-Pro :入力コスト3.2元+出力コスト16元、合計コストは約19.2元。
- キミ・ムーンショットV1 :入力コスト10元+出力コスト30元で、合計コストは約40元です。
最低価格帯と最高価格帯の差は4.4倍です。同じ数のトークンを処理するタスクの場合、KimiはDeepSeekやMiMoの約4倍のコストがかかります。コンテキストが長くなるほどリソース消費量が増えるという現実を考慮すると、長文テキストのシナリオではこの差はさらに広がります。
この比較は、基本モデルAPIの公開されている入力価格と出力価格に限定されています。Qwen3-Maxの出力価格は見つかりませんでした(入力価格8.81元/百万トークンのみが見つかりました)。また、ZhipuのGLM-5の具体的な単価も、価格上昇後に公開チャネルに更新されていないため、確認できませんでした。これら2社のデータは補完する必要があります。
翻訳、要約、簡単な質問応答といった、本質的に手作業であるタスクの場合、価格差が4倍以上であれば、低価格モデルを選択することにほとんど躊躇の余地はありません。しかし、複数回のエージェント呼び出し、長いコード生成、長距離推論といった、より高度な知的スキルを要する複雑なタスクの場合、価格比較だけを意思決定の基準にすべきではありません。OmniToolsは、すべてのシナリオをカバーする単一のモデルを使用するのではなく、企業は社内でタスクを分類し、頻度の高い単純なタスクと頻度の低い複雑なタスクを分けてモデルを選択することを推奨しています。
開発者の移行コストと新しい選択ロジック
価格が下がった後、モデルを変更すべきでしょうか?この質問に対する答えは、開発元によって全く異なります。
基本的なシナリオに取り組む開発者にとって、移行コストは非常に低く抑えられます。DeepSeekとXiaomi MiMoはどちらもOpenAI APIフォーマットに対応しており、コード内のモデルパラメータとベースURLを変更するだけで簡単に切り替えが可能です。コミュニティの開発者からは、基本的に2行のコードを変更するだけで済むという報告がすでに寄せられています。Xiaomiがコンテキストの長さに基づく段階的な料金体系を廃止したことで、開発者は長文シナリオごとに個別のコスト最適化を行う必要がなくなり、より簡潔なコードロジックを実現できます。
特定のモデルの高度な機能に深く依存するアプリケーションの場合、状況は異なります。製品がKimiの長いコンテキストウィンドウ、Zhipu GLM-5の特定のエージェントツール呼び出しフォーマット、または特定のモデル独自の出力スタイルに大きく依存している場合、移行コストは2行のコード変更をはるかに超え、プロンプトの再設計、関数呼び出しチェーンの再デバッグ、エッジケースの再処理が必要になる可能性があります。このコストはAPIの単価では賄えません。
これはまさに市場で起こっている自然な階層化、すなわち一般的なタスク量に応じた価格設定と、複雑なタスク量に対応した機能という二極化です。この二つの流れは共存し、それぞれに十分な市場スペースが確保されるでしょう。Zhipuが価格を83%引き上げたにもかかわらず通話量が400%増加したこと、そしてDeepSeekが価格を3元まで引き下げた後も事業を継続できたことは、これら二つの論理が矛盾なく共存できることを示しています。
企業調達の意思決定者にとって、マルチモデルルーティングメカニズムを確立することは有効です。すなわち、頻度が高く複雑性の低いタスクには低価格モデルを使用して基本コストを削減し、頻度が低く難易度の高いタスクには高価格・高性能モデルを使用してタスクの成功を確実にします。これら2つのアプローチを組み合わせることが、現在のコスト最適化ソリューションとなります。
今回の価格差別化の本質は、「技術プレミアム」から「エコシステム補助金」への移行である。
最後に、核心的な疑問に答えましょう。なぜ片側は急激な下落を経験している一方で、もう片側は急激な上昇を経験しているのでしょうか?
Xiaomiの公式説明は「フルスタック推論の最適化とサービス効率の向上」であり、技術的な詳細は後日公開される技術ブログで明らかにされる予定だ。既知のアーキテクチャ情報に基づくと、MiMo-V2.5はMoEアーキテクチャを採用しており、合計1.02T個のパラメータのうち42バイトのみがアクティブ化され、推論効率において構造的な優位性を示している。DeepSeekもMoEアーキテクチャを採用していることで知られており、その推論コストは同等の機能を持つDenseモデルよりも桁違いに低い。
しかし、技術革新によるコスト削減は十分条件ではない。より根本的な理由は、産業構造の違いにある。
Alibaba、ByteDance、Xiaomiといった大手テクノロジー企業のAPIは、本質的にはより大きなビジネスエコシステムへの顧客獲得の入り口となっている。AlibabaはQianwenを使ってAlibaba Cloudに接続し、ByteDanceはDoubaoを使ってVolcano Engineを活用し、XiaomiはMiMoを使って端末と開発者エコシステムを拡大している。APIは必ずしも利益を上げる必要はなく、クラウドサービスのサブスクリプション、コンピューティングパワーの消費、ハードウェアの出荷、広告から収益を生み出す限り、長期的にわずかな損失を出しても構わない。これは「エコシステム補助金」の論理であり、これらの大企業はエコシステム内に他の収益源を持っており、それによって低価格のAPIを補助しているのだ。
ZhipuやKimiのようなスタートアップ企業には、このような補助金制度はありません。研究開発費やコンピューティングコストを賄うには、API自体からの収益に頼る必要があり、商業的な利益を追求しなければなりません。エージェント時代におけるトークン消費の爆発的な増加を考えると、低価格を維持することは、販売量が増えるほど損失が大きくなることを意味します。価格を上げることは、実際には合理的な経営判断と言えるでしょう。
この構造的な違いは、短期的には解消されないだろう。大企業はAPIで利益を追求しようとはせず、スタートアップ企業は資金を浪費していつまでもこのゲームを続ける余裕はない。二つの価格設定ロジックは長期間共存し、市場はやがて安定した二本立てシステムを形成するだろう。
これは開発者や企業顧客にとって朗報です。基本的な作業のほとんどを最小限のコストで完了できるだけでなく、「インテリジェンス」を必要とする真に複雑なタスクを処理できる強力なモデルも利用できます。重要なのは、どのモデルを使用するかを選択することではなく、どのモデルをいつ使用するかを知ることです。




