AMDは、NvidiaのDGX Sparkを直接的にターゲットとした小型AIデスクトップPCを発表した。

2026年6月、AMDはサンフランシスコで開催されたAI DevDayで、新デバイスの出荷計画を正式に発表した。このマシンはApple Mac miniとほぼ同じサイズで、128GBの統合メモリを搭載し、ローカルAI開発プラットフォームとして位置づけられている。その数ヶ月前には、NVIDIAのDGX Sparkが開発者のデスクトップに登場しており、こちらも手のひらサイズの金属製筐体で、128GBの統合メモリを搭載し、2000億個のパラメータを持つ大規模モデルをローカルで実行できると謳っていた。

AMD Ryzen AI Halo開発者プラットフォームは、Ryzen AI Max+ 395プロセッサを搭載しています。

Tom's HardwareによるHP Z2 Mini G1aのレビューでは、AMDの推奨価格帯は2,949ドルから3,999ドルとされている。Nvidiaのウェブサイトによると、DGX Sparkは3,999ドルからで、一部のOEM版は2026年2月に4,679ドルまで値上がりすると報じられている。AMDは価格面で優位に立っているように見えるが、これは表面的なものに過ぎない。

同じ128GB、2つの異なるルート

AMDのRyzen AI Haloの中核を成すのは、16個のZen 5コアと40個のRDNA 3.5アーキテクチャGPU演算ユニット、そして50 TOPSのXDNA 2 NPUを搭載したRyzen AI Max+ 395プロセッサです。NVIDIAの公式ハードウェアドキュメントでは、DGX Sparkは異なる説明がされています。GB10 Grace Blackwell Superchip、20コアのARM CPUとBlackwellアーキテクチャGPUの組み合わせで、NPUは搭載されていませんが、ConnectX-7 200Gbpsネットワークカードが搭載されています。AMDデバイスは2.5GbE EthernetとWiFi 7を提供しますが、NVIDIAデバイスは10GbEとWiFi 7に加え、高価な高速ネットワークカードを提供します。

メモリ仕様は一見似ている。どちらも128GBのLPDDR5xだ。AMDの製品ページではメモリ帯域幅が256GB/sと記載されているのに対し、NVIDIAの公式数値は273GB/sとなっている。その差は7%未満であり、ほとんどの推論タスクではほとんど感知できない。

オペレーティングシステムの選択は、両社のより根本的な違いを明らかにします。AMD Ryzen AI HaloにはWindows 11 Proがプリインストールされており、オプションでUbuntu 24.04も選択可能です。Thunderboltポートを備え、一般的な周辺機器を完全にサポートする標準的なPCデスクトップが起動します。一方、DGX SparkはUbuntuのカスタマイズ版であるDGX OSで動作し、起動後最初に行うべきことはCUDA環境とNVIDIAコンテナツールチェーンの設定です。

The Registerは2025年12月に詳細なフィールドテスト比較を実施しました。その結果、単一バッチの大規模言語モデル推論では、2台のマシンのトークン生成速度は非常に近いことが分かりました。しかし、プロンプト処理フェーズでは、DGX Sparkの方が2～3倍高速でした。この差は、Blackwellアーキテクチャの低精度計算のサポートと、NVIDIAが推論パイプラインで長年行ってきたコードパス最適化に起因しています。ServeTheHomeのレビューでは、別の側面も指摘されています。DGX SparkのConnectX-7ネットワークカードは900ドル以上で販売されており、マルチマシンクラスタシナリオにおけるその潜在的な価値は、シングルマシン推論の範囲をはるかに超えています。

Tom's Hardwareなどのメディアによるテストによると、Ryzen AI Haloは高さ85mm、幅168mm、奥行き200mm、重量2.3kgで、従来のミニワークステーションに近いサイズです。NVIDIAの公式ドキュメントによると、DGX Sparkは150mm四方、厚さ50.5mm、重量1.2kgです。片方は積み重ねたハードドライブのエンクロージャーに似ており、もう片方はルーターに似ています。

ROCmのプログレスバーはもはや「十分」とは言えない。

AMDの公式発表によると、ROCm 7.2は2026年1月にリリースされ、その後のバージョン7.2.4ではAI推論ワークロードの安定性とパフォーマンスが最適化される予定です。Phoronixはリリース当日に詳細な記事を掲載しました。

Linux の開発者にとって、ROCm のインストールプロセスは 2 年前よりもはるかに簡単になりました。2026 年 3 月、技術ブロガーの Kunal Ganglani 氏は、詳細な ROCm ユーザーガイドの中で、システム構成から RX 7900 XTX 上で PyTorch モデルを実行するまでの全プロセスをわずか 30 分程度で完了したと書いています。「2024 年であれば、同じことをするのに半日かかっていたでしょう。」彼のブログでは、ROCm が現在、PyTorch、TensorFlow、JAX、DGL の 4 つの主要なディープラーニングフレームワークをサポートしており、vLLM、Ollama、llama.cpp などの推論エンジンもすべて ROCm バックエンドを利用できることが確認されています。

しかし、これらの進歩をもってしても、CUDAの成長の勢いを止めることはできません。NVIDIAのソフトウェアスタックは17年以上にわたって構築されており、Stack OverflowにおけるCUDA関連の質問と回答の数は、ROCmの数十倍にもなります。FlashAttentionやxFormersといった最先端ライブラリの新バージョンは、通常、まずCUDAバージョンとしてリリースされ、ROCm版が登場するまでには数週間から数ヶ月かかります。PyTorch標準APIの範囲を超えるカスタムCUDAカーネルは、AMDプラットフォーム上で手動での適応が必要です。AMDの公式互換性マトリックスには検証済みのフレームワークとGPUの組み合わせが記載されていますが、「検証済み」と「問題が発生したときにそれを見つけるのに十分なコミュニティの議論スレッドがあること」は別物です。

Redditのr/LocalLLaMAサブレディットでは、どのデバイスを選ぶべきかについての議論が2025年末から続いています。最も頻繁に引用される要約は、Ganglani氏のブログ記事の最後の部分です。「初日からすべてが完璧に動作することを望むなら、NVIDIAを購入してください。800ドル節約するために午後をかけて問題を解決する覚悟があるなら、ROCmが適しています。」

AMDはこの点を非常によく理解しているようだ。同社はこの1年間、Nvidiaの優位性を直接模倣するのではなく、むしろその外側で新たなスタートを切ってきた。

2024年8月、AMDはZT Systemsを49億ドルで買収すると発表した。ウォール・ストリート・ジャーナルは2025年3月にこの取引の完了を確認した。ZT Systemsは、マイクロソフトやメタといった年間数万個のGPUを購入する巨大企業を含むハイパースケールデータセンター顧客向けに、ラック規模のAIサーバーシステムを設計・組み立てている。AMDは、個々のGPUからラック全体に至るまでのシステム設計能力を獲得した。

しかし、AMDはすぐに一見矛盾するような決断を下した。Sanminaの公式発表によると、2025年5月、AMDはZT Systemsのデータセンター製造事業を電子機器製造サービスプロバイダーにスピンオフし、設計チームのみを残した。その論理は明白だ。AMDはOEM顧客の競合相手になりたくなかったのだ。もしAMDが自社でAIサーバーを製造すれば、AMDグラフィックカードを販売するサーバーメーカーはすぐに警戒するだろう。設計能力を維持し、製造を外部委託することで、この動きは能力強化とエコシステムとの関係性のバランスを取ったものだった。

その後の6ヶ月間に、さらに2つの重要な出来事が起こった。

2025年10月、AMDはOpenAIとの戦略的パートナーシップを正式に発表し、6GWのAMD Instinct GPUを導入することを明らかにした。最初の1GWは2026年後半に出荷予定。この契約には、OpenAIがAMD株の最大10%を取得できる条項が含まれている。ロイター通信とCNBCはこの詳細を同日の報道で取り上げた。OpenAIに供給されるGPUは次世代Instinct GPUとなるが、AMDは具体的なモデル名を明らかにしていない。

2026年2月、AMDはMetaとの提携拡大を発表する別の公式プレスリリースを発表し、6GWのGPUを導入することを明らかにした。今回導入されるチップはMeta MI450のカスタムバリアントで、2026年後半に出荷開始予定である。同日、CNBCの報道では、この提携が発表されるわずか数日前に、MetaがNvidiaとのAIチップ調達契約の拡大も発表していたことが報じられた。

Metaが両社から同時に長期契約を獲得できたことは、技術的な比較よりもはるかに説得力がある。AIインフラに年間数百億ドルを投資する企業にとって、すべての卵を一つのカゴに入れるのは容認できないリスクだ。AMDはNvidiaをあらゆる面で凌駕する必要はなく、Nvidiaに代わる実行可能な選択肢を提供するだけで、「二社供給」の論理に基づき受注を確保できる。2件の6GW契約の規模は、少なくともOpenAIとMetaが契約にAMDを含めていることを示唆している。

同時に、Nvidiaは複数の対策を組み合わせた対応をとった。

同時に、NVIDIA はエンタープライズ市場で多方面からの攻勢を開始しました。DGX Spark は開発者向けデスクトップデバイスとして位置付けられていますが、ConnectX-7 ネットワークインターフェイスカード (NIC) により、孤立したワークステーションではありません。ServeTheHome のレビューでは、プロトタイピング、分散トレーニング、デバッグにおける NIC の価値を詳細に分析し、データセンターグレードの NVLink より大幅に遅いものの、小規模クラスタシナリオには十分であると結論付けています。この設計により、DGX Spark は NVIDIA のより広範なエンタープライズ製品ラインに位置付けられます。開発者は Spark を使用してプロトタイピングを行い、コードを DGX Station またはクラウドベースの DGX インスタンスに移行し、最終的に H200 または B200 プロセッサを搭載したサーバークラスタに展開します。デスクトップからデータセンターまで一貫したハードウェアおよびソフトウェアツールチェーンが CUDA とシームレスに統合されています。

NVIDIAは同時に、TensorRT、RAPIDS、Triton推論サーバーなどのツールをバンドルし、ノード単位で課金するAI Enterpriseソフトウェアサブスクリプションスイートも発表した。NVIDIAの公式製品ページには、AI Enterpriseに含まれるツールの全リストが掲載されている。これはハードウェアを販売するものではなく、開発者がCUDAに慣れた後、エンタープライズレベルの導入とメンテナンスを継続的な有料ビジネスに転換することを目的としている。

両側の経路を比較すると、その相違は明白である。

Nvidiaは、チップからシステム、ソフトウェア、クラウドサービスに至るまで、完全なクローズドループシステムを構築しました。開発者はこのクローズドループ内で、初日から最適化されたツールを使用できますが、その代償として単一ベンダーのエコシステムに縛られることになります。一方、AMDはオープンな代替アプローチを採用しています。業界標準のx86アーキテクチャを使用し、WindowsとLinuxの両方のシステムをサポートし、ROCmを主流のフレームワークと互換性のあるオープンソーススタックにすることで、コスト重視の顧客や、ベンダーリスクを分散して低価格で製品を購入しようと考えている顧客を引き付けています。

Ryzen AI Halo製品自体は、このアプローチの最もシンプルなハードウェア実装例です。カスタムネットワークカード、専用OS、低精度トレーニングアクセラレーションユニットは搭載されていません。200バイトのモデルを実行できる統合メモリとそこそこのGPUを巧みに組み込んだ汎用PCです。大規模モデルの推論に使用したり、ターミナルを閉じてPhotoshopを開いたりできます。Tom's Hardwareのレポートでは、HP Z2 Mini G1aの価格は2,949ドルとされており、DGX Sparkの開始価格3,999ドルよりも大幅に低くなっています。他のOEMバージョンでは、価格差は1,000ドルを超える可能性があります。

しかし、この柔軟性には代償が伴います。The Register の実世界のテストデータによると、焦点が単一バッチ推論から大規模並列コンピューティングを必要とするシナリオに移ると、Blackwell アーキテクチャの低精度の利点と長年にわたる最適化されたソフトウェアスタックがすぐに明らかになります。Stable Diffusion グラフィックスを実行できるデスクトップボックスが必要な場合は、NVIDIA の CUDA エコシステムがすぐに使用できるツールの完全なセットを提供します。AMD の RDNA 3.5 アーキテクチャは FP4 および FP8 の低精度フォーマットをサポートしていないため、画像生成などのワークロードでパフォーマンス上の不利が生じます。これは RDNA アーキテクチャ設計に固有のものであり、ドライバの更新で解決することはできません。

箱の本当の居場所は、箱の中ではない。

時系列を振り返ってみると、過去1年間のAMDの行動はかなり明確なパターンを示している。

ハードウェア面では、Instinct MI300とMI325Xは量産段階に入っており、MI350とMI450はロードマップ通りに開発が進んでいます。Ryzen AI Max+ 395はノートPC向けチップからデスクトップAPUへと進化し、開発プラットフォームに統合されました。システムレベルでは、ZT Systemsの買収によりラックマウント設計能力を獲得し、その後、研究開発部門は維持しつつ製造部門を分社化しました。顧客レベルでは、世界最大のAIコンピューティングパワー消費企業2社をそれぞれ合計6GWの長期契約2件で結びつけ、偶然にもOpenAIを株主リストに加えることになりました。ソフトウェア面では、ROCmは四半期ごとに約1バージョンのペースでイテレーションを繰り返し、主流のフレームワークサポートに追いついていますが、最先端のライブラリの移植やコミュニティの構築にはまだ時間がかかります。

各ステップは独立して存在するものではありません。ZT Systemsの買収は、単にサーバーメーカーにGPUを販売するのではなく、OpenAIやMetaが必要とするような大規模AIクラスターの設計を可能にするためでした。ROCmの迅速なイテレーションは、6GW契約を結んだ顧客がベアメタルではなく、展開に使えるソフトウェアスタックを確実に利用できるようにするためでした。Ryzen AI Haloの発売は、同じROCmエコシステムをデスクトップに拡張し、開発者が3,000ドルのマシンでローカルデバッグを行い、その後、モデルをクラウドのMI450クラスターに展開できるようにするためでした。

これはAMDがNvidiaに追いついたという意味ではありません。2件の6GW契約は将来の展開に関するコミットメントであり、ギガワット規模のエネルギー容量はインフラ計画の規模を反映したもので、既に出荷されたチップの数ではありません。MI450の具体的な仕様はまだ公開されておらず、大規模展開後のチップの実際の性能、歩留まり、安定性はすべて不明です。ROCmは主流のフレームワークで「使いやすさ」を実現しましたが、「問題が発生したときにコミュニティが助けてくれる」状態を達成するには、さらに蓄積する時間が必要です。そして、CUDAの17年間の蓄積は、数四半期の急速な反復で消化できるものではありません。

Nvidiaの競争優位性はソフトウェアだけにとどまりません。DGX Spark用のConnectX-7ネットワークカードは、競争のもう一つの側面を示唆しています。AMDがコスト効率とオープン性を武器に開発者を惹きつけようとしている一方で、Nvidiaはクラスタのスケーラビリティによって、分散トレーニングや大規模な推論パイプラインを必要とするチームを囲い込んでいるのです。DGX Sparkは1台3,999ドルで、2台とネットワークケーブルを購入すれば分散プロトタイプを実行できます。このシナリオでは、単一マシンでの推論におけるROCmの優位性は相殺されます。

AIに関する両社の意見の相違は、最終的にはこの手のひらサイズのボックスに関する具体的な選択に帰着する。AMDのボックスを開けば、使い慣れたPC環境が手に入り、ほぼ同じコマンドでPyTorchをインストールし、モデルをロードして推論を開始する。CUDAバックエンドのみを持つライブラリを使用する必要が生じるまでは、プロセスはスムーズだ。一方、NVIDIAのボックスを開けば、ハードウェアからドライバー、コンテナツールチェーンまで最適化された専用環境が手に入る。すべてが期待通りに始まるが、1000ドルを超えるわずかな追加料金が発生し、将来ベンダーを切り替える際の移行コストも既に確定している。

AMDはNvidiaのフルスタック帝国に直接挑戦したわけではない。代わりに、より現実的な道を選んだ。Nvidiaの価格設定やサプライチェーンの供給能力が顧客のあらゆる需要に対応できない場合に、十分な代替手段を提供するという道だ。2件の6GW契約は、これまでのところこの戦略の最も強力な証拠と言える。Ryzen AI Haloは、デスクトップにおけるこの戦略の延長線上にある。小型AIボックスを作るというトレンドに盲目的に従うのではなく、「オープンなエコシステムとコスト面での優位性を活用して、特定のプラットフォームに縛られたくない開発者を引き付ける」という道をさらに一歩進めたものだ。