AMD發布小型AI主機,直指英偉達DGX Spark

https://www.omnitools.ai/article/128gb-amd

2026年6月,AMD在舊金山AI DevDay上確認了一款新設備的出貨計畫。這台機器和蘋果Mac mini差不多大,搭載128GB統一內存,官方定位是本地AI開發平台。就在幾個月前,英偉達的DGX Spark已經出現在開發者的桌面上,同樣是巴掌大的金屬盒子,同樣是128GB統一內存,同樣宣稱能在本地運行2000億參數的大模型。

AMD Ryzen AI Halo 迷你 PC 產品圖

AMD Ryzen AI Halo 開發者平台,搭載Ryzen AI Max+ 395 處理器

Tom's Hardware基於HP Z2 Mini G1a的實測報告了AMD陣營的參考定價:$2,949到$3,999。英偉達官網顯示DGX Spark起價$3,999,部分OEM版本在2026年2月有過漲至$4,679的討論。價格上AMD壓了一頭,但這只是表面帳。

同樣的128GB,兩條不同的路線

AMD Ryzen AI Halo的核心是一顆Ryzen AI Max+ 395處理器,16個Zen 5核心,40個RDNA 3.5架構的GPU運算單元,旁邊還掛著一顆50 TOPS算力的XDNA 2 NPU。 NVIDIA官方硬體文件對DGX Spark的描述是另一套邏輯:GB10 Grace Blackwell Superchip,20核心ARM CPU搭配Blackwell架構GPU,沒有NPU,但塞進了一張ConnectX-7 200Gbps網路卡。 AMD設備提供2.5GbE網口和WiFi 7;英偉達這邊是10GbE加WiFi 7,外加那張價值不斐的高速網卡。

內存規格表面接近。兩邊都是128GB LPDDR5x。 AMD的產品頁面標註記憶體頻寬為256 GB/s,NVIDIA官方給出的數字是273 GB/s。差距不到7%,在大多數推理任務中幾乎感知不到。

作業系統選擇暴露了兩家更根本的分歧。 AMD Ryzen AI Halo預載Windows 11 Pro,選配Ubuntu 24.04。開機進入的是標準PC桌面,有Thunderbolt接口,有完整的通用周邊支援。 DGX Spark跑的是DGX OS,基於Ubuntu定制,開機後第一件事是配置CUDA環境和NVIDIA容器工具鏈。

The Register在2025年12月做了一次詳細的實測比較。結論是:單批次大語言模型推理時,兩台機器的token產生速度非常接近。但在prompt處理階段,DGX Spark快出2到3倍。這個差距來自Blackwell架構對低精度運算的支持,以及NVIDIA在推理管線上的數年程式碼路徑最佳化。 ServeTheHome的評測則指出了另一個維度:DGX Spark的ConnectX-7網卡單獨零售價超過$900,它在多機集群場景中的潛在價值遠遠超出單機推理的範疇。

根據Tom's Hardware等媒體實測,Ryzen AI Halo的尺寸為85mm高、168mm寬、200mm深,重2.3公斤,更接近傳統迷你工作站的體格。 NVIDIA官方文件顯示DGX Spark是150mm見方、50.5mm厚,重1.2公斤。一個像是堆疊的硬碟盒,一個像路由器。

ROCm的進度條,不再只是“能用就行”

AMD官方發布說明顯示,ROCm 7.2於2026年1月上線,隨後的7.2.4版本專門優化了AI推理工作負載的穩定性和性能。 Phoronix在發布當天做了詳細報導。

對於Linux環境下的開發者,ROCm現在的安裝流程已經比兩年前簡化了許多。 2026年3月,技術部落客Kunal Ganglani在一篇詳細的ROCm使用指南中寫道,他在RX 7900 XTX上完成從系統配置到運行PyTorch模型的全過程只花了約30分鐘,「而在2024年,乾同樣的事需要折騰半天」。他的部落格確認ROCm目前已支援PyTorch、TensorFlow、JAX、DGL四個主流深度學習框架,vLLM、Ollama、llama.cpp等推理引擎均有ROCm後端可用。

但這些進展擋不住CUDA的慣性。英偉達的軟體堆疊累積了17年,Stack Overflow上的CUDA相關問答數量是ROCm的幾十倍。 FlashAttention、xFormers等前沿函式庫的新版本通常會先出CUDA版,ROCm移植版要等數週到數月。任何超出PyTorch標準API範圍的自訂CUDA內核,在AMD平台上都需要手動適配。 AMD官方相容性矩陣列出了已驗證通過的框架和GPU組合,但「通過驗證」和「出問題時有足夠多的社群討論帖能搜到」是兩碼事。

Reddit的r/LocalLLaMA板塊上,關於該選哪台設備的討論貼文從2025年底就沒斷過。最常被引用的一條總結來自Ganglani那篇博客的結尾:“如果你需要一切在第一天就完美運行,買NVIDIA。如果你願意花一個下午解決問題來省$800,ROCm已經準備好了。”

AMD似乎很清楚這一點。過去一年,這家公司的動作不是在正面複製英偉達的護城河,而是在護城河外另起爐灶。

2024年8月,AMD宣布以$49億收購ZT Systems。華爾街日報在2025年3月確認交易完成。 ZT Systems的業務是幫超大規模資料中心客戶設計和組裝整機架等級的AI伺服器系統,客戶包括微軟、Meta這類每年採購數萬張GPU的巨頭。 AMD拿到的是從單顆GPU到整機架的系統設計能力。

但AMD很快就做了一個看似矛盾的決定。 2025年5月,根據Sanmina官方公告,AMD將ZT Systems的資料中心製造業務剝離給了這家電子製造服務商,自己只保留設計團隊。邏輯很清楚:AMD不想變成自己OEM客戶的競爭對手。如果AMD自己生產AI伺服器,那些賣AMD顯示卡的伺服器廠商會立刻警覺。保留設計能力、外包製造,這手操作平衡了能力進補和生態關係。

更關鍵的兩件事發生在隨後半年。

2025年10月,AMD官方新聞稿宣布與OpenAI達成策略合作,部署6GW的AMD Instinct GPU。首批1GW定於2026年下半年出貨。這份協議裡藏了一個條款:OpenAI可選擇購買AMD最多10%的股票。 Reuters和CNBC在當天的報導中都強調了這個細節。為OpenAI供貨的將是下一代Instinct GPU,AMD未公開特定機型。

2026年2月,AMD再次發布官方新聞稿,宣布與Meta的擴展合作,同樣部署6GW GPU。這次的晶片是Meta定制的MI450變體,計劃2026年下半年開始出貨。 CNBC當天的報導點出了一個細節:就在這筆合作公開前幾天,Meta也宣布了與英偉達的擴展AI晶片採購協議。

Meta同時簽下兩家的長期訂單,這件事本身比任何技術對比都更有說服力。對於每年在AI基礎設施上投入數百億美元的企業,把雞蛋放在一個籃子裡是不可接受的風險。 AMD不需要性能全面超越英偉達,只需要在英偉達之外提供一個可用的選項,就能在「雙供應商」的邏輯下切到訂單。兩個6GW合約的規模暗示,至少OpenAI和Meta已經把AMD列入這張單子了。

英偉達同期的應對,是一套組合拳

同一個時段,英偉達在企業級市場打的是組合拳。 DGX Spark定位為開發者桌上型設備,但它的ConnectX-7網路卡決定了它不是孤立的工作站。 ServeTheHome的評測詳細分析了這張網卡在原型驗證和分散式訓練調試中的價值,結論是雖然比資料中心級的NVLink慢很多,但對於小規模集群場景已經夠用。這個設計把DGX Spark錨定在了英偉達更大的企業產品線中:開發者用Spark做原型,然後把程式碼遷移到DGX Station或雲端DGX實例,最後部署到搭載H200或B200的伺服器叢集。一條從桌面到資料中心、軟硬體一致的工具鏈被焊死在CUDA上。

英偉達同期也推出了AI Enterprise軟體訂閱套件,把TensorRT、RAPIDS、Triton推理伺服器等工具打包,按節點收費。 NVIDIA官方產品頁列出了AI Enterprise包含的完整工具清單。這不是賣硬件,是在開發者習慣CUDA之後,把企業級部署和維運也變成持續付費的生意。

對比一下兩邊的路徑,分歧已經夠清楚。

英偉達做的是一個從晶片到系統到軟體到雲端服務的全端閉環。開發者進入這個閉環的第一天就可以用優化好的工具,代價是被綁定在一個供應商的生態。 AMD走的是一條開放替代路線:用業界標準的x86架構,支援Windows和Linux雙系統,把ROCm做成相容主流框架的開源棧,用更低的價格爭取那些對成本敏感或已經決定分散供應商風險的客戶。

Ryzen AI Halo這個產品本身就是這條路線最簡潔的硬體表現。它沒有客製化網路卡,沒有專用OS,沒有低精度訓練加速單元。它是通用PC,剛好塞進了能跑200B參數模型的統一記憶體和一套還算過得去的GPU。你可以用它跑大模型推理,也可以關掉終端機去開Photoshop。 Tom's Hardware在報告中引用的HP Z2 Mini G1a $2,949的價格,遠低於DGX Spark $3,999的起步價,如果換成其他OEM版本,價差可能拉到$1,000以上。

但這種靈活性的背面是妥協。 The Register的實測數據已經說明,一旦離開單批次推理進入需要大量並行計算的場景,Blackwell架構的低精度優勢和數年優化的軟體棧會迅速拉開差距。如果你需要一個能跑Stable Diffusion出圖的桌面盒子,NVIDIA的CUDA生態裡有一整套即裝即用的工具。 AMD的RDNA 3.5架構不支援FP4和FP8低精度格式,在影像產生這類工作負載上效能吃虧,這是RDNA架構設計決定的,不是驅動更新能解決的。

盒子的歸宿,不在盒子裡

把時間線收回來,AMD近一年的動作構成一條相當清晰的路線。

硬體層面,Instinct MI300和MI325X量產,MI350和MI450依路線圖推進,Ryzen AI Max+ 395從筆記型晶片變成桌上型APU塞進開發平台。系統層面,透過收購ZT Systems拿到機架級設計能力,然後剝離製造保留研發。客戶層面,用兩份6GW等級的長期合約綁定全球最大的兩個AI算力消費者,順便把OpenAI拉進股東名單。軟體層面,ROCm以大概每季一個版本的速度迭代,追上主流框架支持,但前沿庫的移植和社群累積還需要時間。

每一步都不是孤立的。收購ZT Systems是為了有能力設計OpenAI和Meta所需的那種超大規模AI集群,而不是只賣GPU給伺服器廠商。 ROCm的快速迭代是為了讓簽下6GW合約的客戶在部署時有可用的軟體棧,而不是裸機交付。 Ryzen AI Halo的推出是為了把同一個ROCm生態延伸到桌面端,讓開發者可以用一台$3,000的機器做本地調試,再把模型部署到雲端MI450集群上。

但這不代表AMD已經追上了英偉達。兩份6GW合約是未來的部署承諾,以吉瓦計算的能源容量反映的是基礎設施規劃規模,不是已經出貨的晶片數量。 MI450的具體規格至今尚未公開,晶片的實際效能、良率、大規模部署後的穩定性都是未知數。 ROCm在主流框架上做到了“能用”,但“出問題時社區能幫到你”這個狀態還需要更長時間累積。而CUDA的17年累積不是靠幾個季度快速迭代就能消化的。

英偉達的護城河也不只是在軟體上。 DGX Spark那張ConnectX-7網卡暗示的是另一個競爭維度:當AMD在用性價比和開放性爭取開發者時,英偉達在用集群擴展能力鎖定那些需要做分佈式訓練和大型推理管線的團隊。買一台DGX Spark是$3,999,買兩台加上網路線就可以跑分散式原型。在這個場景下,ROCm在單機推理上打平的優勢就被消解了。

兩家公司在AI上的分歧,最後落在這個巴掌大的盒子上時,變成了一個具體的選擇題。你打開AMD的盒子,得到一個熟悉的PC環境,用幾乎一樣的指令裝好PyTorch,載入模型,開始推理,過程順暢,直到你需要用某個只有CUDA後端的函式庫。你打開英偉達的盒子,得到了一個從硬體到驅動到容器工具鏈都優化好的專用環境,啟動後一切都在預期內,只是賬單上多了一千多美元,而且今後換供應商的遷移成本已經被提前鎖定了。

AMD沒有正面挑戰英偉達的全端帝國。它選擇了一條更務實的路:在英偉達的定價和供應鏈交付能力跟不上所有客戶需求時,做一個夠用的替代選項。兩個6GW合約是這個策略到目前為止最有力的證據。 Ryzen AI Halo是這個策略在桌面端的延伸,不是跟風做小型AI盒子,而是沿著「用開放生態和成本優勢爭取不想被鎖定的開發者」這條線往前走了一步。

分享至:

作者:OmniTools

本文為PANews入駐專欄作者的觀點,不代表PANews立場,不承擔法律責任。

文章及觀點也不構成投資意見

圖片來源:OmniTools如有侵權,請聯絡作者刪除。

關注PANews官方賬號,一起穿越牛熊
PANews APP
SpaceX盤前一度漲逾10%,逼近全球市值前五
PANews 快訊