Meta:買得起千億算力,留不住關鍵的人

  • 核心事件:龐若鳴從Meta跳槽到OpenAI,引發對Meta AI人才流失的關注。
  • Llama 4風波:Meta的Llama 4模型在基準測試中造假,摧毀了開源社區的信任,導致組織重組。
  • 芯片計劃:Meta取消自研訓練芯片項目,轉向大規模採購英偉達、AMD和谷歌的芯片,總額可能超千億美元。
  • 算力焦慮:採購反映Meta的算力需求,但多供應商策略帶來工程複雜度,同時人才流失加劇。
  • 扎克伯格策略:扎克伯格重複元宇宙時代的投資模式,大量資金投入AI,但模型表現未知。
  • 未來展望:Meta的AI成功取決於代號Avocado的下一代模型,若失敗,巨額投資可能白費。
總結

撰文: Ada ,深潮TechFlow

龐若鳴在Meta 的工位還沒坐熱,就走了。

2025 年7 月,祖克柏用一份總價超過2 億美元的多年薪酬方案,從蘋果手中搶走了這位AI 基礎設施領域最搶手的華人工程師。龐若鳴被安排進Meta 超級智慧實驗室,負責搭建下一代AI 模型的基礎設施。

7 個月後,OpenAI 把他挖走了。

根據The Information 報道,OpenAI 對龐若鳴展開了長達數月的招募攻勢。儘管龐若鳴曾告訴同事“自己在Meta 工作得非常愉快”,但最終還是選擇了離開。根據彭博社報道,他在Meta 的薪酬方案與里程碑掛鉤,提前離職意味著放棄大部分未兌現的股權。

2 億美元,買不了7 個月的忠誠。

這不是一個簡單的跳槽故事。

一個人的離開,一群人的訊號

龐若鳴不是第一個走的。

上週,Meta 超級智慧實驗室開發者平台產品負責人Mat Velloso 也宣布離職,此人去年7 月從GoogleDeepMind 離職加入Meta,待了不到8 個月。再往前推,2025 年11 月,在Meta 待了12 年的圖靈獎得主、首席AI 科學家Yann LeCun 宣布離職創業,做他一直鼓吹的「世界模型」。 Geoffrey Hinton 的核心弟子、Meta 生成式AI 研究副總裁Russ Salakhutdinov 也在近期官方宣布離開。

要理解Meta AI 的人才流失,得先理解Llama 4 到底有多傷。

2025 年4 月,Meta 高調發表Llama 4 系列的Scout 和Maverick 模型。官方的紙面數據堪稱華麗,聲稱在MATH-500 和GPQA Diamond 等核心基準測試(Benchmark)中,全面壓制了GPT-4.5 和Claude Sonnet 3.7。

然而,這款承載著Meta 野心的旗艦模型,在開源社區的第三方獨立盲測中迅速“現了原形”,實際泛化與推理能力與宣傳出現了斷崖式落差。面對社群的強烈質疑,首席AI 科學家Yann LeCun 最終承認,團隊在測試階段「使用了不同的模型版本來跑不同的測試集,以優化最終得分」。

在嚴謹的AI 學術界與工程界,這觸碰了不可饒恕的紅線。換句話說,團隊把Llama 4 訓練成了一台只會做往年真題的“小鎮做題家”,而非真正擁有前沿智能的“優等生”。考數學就給你看數學卷王,考程式就給你看程式設計卷王,每個單項測驗看起來都很強,但其實這不是同一個模型。

這在AI 學術界叫“摘櫻桃”,在應試教育界叫“替考”。

對一向以「開源燈塔」自居的Meta 而言,這場風波直接摧毀了其在開發者生態中最寶貴的信任資產。它的直接代價是,祖克柏對原有GenAI 團隊的工程底線“徹底失去信心”,並由此拉開了後續空降高管、架空核心基建部門的序幕。

他花了143 億到150 億美元收購數據標註公司Scale AI 49%的股份,把28 歲的Scale AI CEO Alexandr Wang 空降為Meta 首席AI 官,成立Meta 超級智慧實驗室(MSL)。圖靈獎得主LeCun 在新架構中需要向這位28 歲的年輕人報告。 10 月,Meta 裁撤MSL 約600 個職位,包括LeCun 一手創建的FAIR 研究部門的成員。

而原計劃在2025 年夏天發布的旗艦模型Llama 4 Behemoth 也被一再推遲,從夏天推到秋天,最終無限期擱置。

Meta 轉而開發代號為「Avocado」的下一代文字模型和代號為「Mango」的圖像/視訊模型。據報導,Avocado 的目標是對標GPT-5 和Gemini 3 Ultra。原定2025 年底交付,因為性能測試和訓練優化不達標,推遲到2026 年第一季。 Meta 正在考慮將其閉源發布,放棄Llama 系列一貫的開源傳統。

Meta 在AI 模型上犯了兩個致命錯誤。第一是對benchmark 造假,這直接摧毀了開發者社群的信任;第二是把FAIR 這種需要十年磨一劍的基礎研究部門,硬塞進一個追求季度KPI 的產品組織裡。這兩件事加起來,就是現在人才流失的根本原因。

自研晶片:另一條斷掉的腿

人才在跑,晶片也出了問題。

根據The Information 報導,Meta 上週砍掉了其內部正在開發的最先進AI 訓練晶片項目。

Meta 的自研晶片計畫叫做MTIA(Meta Training and Inference Accelerator)。該公司的初始路線圖雄心勃勃:MTIA v4 代號「Santa Barbara」、v5 代號「Olympus」、v6 代號「Universal Core」計劃在2026 到2028 年間陸續交付。其中Olympus 被設計為Meta 首款基於2nm chiplet 架構的晶片,目標是同時涵蓋高階模型訓練和即時推理,最終取代英偉達在Meta 訓練集群中的角色。

現在,這個最先進的訓練晶片被砍了。

Meta 並非沒有進展,MTIA 在推理端有了一些成果。代號「Iris」的MTIA v3 推理晶片已經在Meta 的資料中心大規模部署,主要用於Facebook Reels 和Instagram 的推薦系統,據稱降低了40%到44%的整體擁有成本。但推理和訓練是兩回事。推理是跑模型,訓練是練模型。 Meta 能自己做推理晶片,但造不出能跟英偉達正面剛的訓練晶片。

歷史上這不是第一次。 2022 年,Meta 曾經嘗試自研推理晶片,在小規模部署失敗後直接放棄,轉頭給英偉達下了大單。

自研晶片受挫,直接加速了Meta 的外購狂潮。

1,350 億美元的恐慌性採購

2026 年1 月,Meta 宣布今年的資本支出預算為1,150 億至1,350 億美元,幾乎是去年722 億美元的兩倍。這筆錢的大頭,都要花在晶片上。

10 天之內,三筆大單接連落地:

2 月17 日,Meta 與英偉達簽署多年期、跨世代策略合作協議。 Meta 將部署「數百萬顆」英偉達Blackwell 和新一代Vera Rubin GPU,外加Grace 獨立CPU。分析師估計交易規模在數百億美元級別,Meta 成為全球第一家大規模部署英偉達Grace 獨立CPU 的超算客戶。

2 月24 日,Meta 與AMD 簽署價值600 億到1000 億美元的多年期晶片協議。 Meta 將採購AMD 最新的MI450 系列GPU 和第六代EPYC CPU。作為交易的一部分,AMD 向Meta 發行了最多1.6 億股普通股的認股權證,相當於AMD 約10%的股份,以每股0.01 美元的價格,按交付里程碑分批歸屬。

2 月26 日,根據The Information 報道,Meta 與Google簽署了一份價值數十億美元的多年期協議,租用谷歌雲端的TPU 晶片來訓練和運行其下一代大語言模型。同時,雙方也正在討論Meta 從2027 年起直接購買TPU 部署到自己的資料中心。

一家社群媒體公司,在10 天內同時向三家晶片供應商下了可能總計超過千億美元的訂單。

這不是多元化佈局。這是恐慌性採購。

算力焦慮的三層邏輯

Meta 為什麼這麼急?

第一,自研晶片指望不上了。最先進的訓練晶片項目被砍,意味著Meta 在可預見的未來只能靠外購來滿足AI 訓練需求。推理端的MTIA 晶片能處理推薦系統這類成熟業務,但要訓練Avocado 這種對標GPT-5 的前沿模型,必須用英偉達或同等級的硬體。

第二,競爭對手不會等。 OpenAI 已經拿到了從微軟、軟銀到阿聯酋主權基金的大量資源。 Anthropic 鎖定了Google和亞馬遜各100 萬顆TPU 和Trainium 晶片的供應。谷歌Gemini 3 完全在TPU 上訓練完成。 Meta 若拿不到足夠的算力,連賽道的入場券都保不住。

第三,也可能是最根本的,祖克柏需要用「購買力」來彌補「研發力」的不足。 Llama 4 翻車、核心人才流失、自研晶片受挫,這三件事疊在一起,讓Meta 的AI 敘事在華爾街面前變得脆弱。此刻簽下英偉達、AMD、谷歌三家的大單,至少釋放一個訊號:我們有錢,我們在買,我們沒有放棄。

Meta 現在的策略就是,搞不定軟體就砸硬件,留不住人就買晶片。但AI 競賽不是一個靠寫支票就能贏的遊戲。算力是必要條件,不是充分條件。沒有頂級的模型團隊和清晰的技術路線,再多的晶片也只是倉庫裡昂貴的存貨。

買家的困境

回頭看Meta 在2 月的三筆交易,一個有趣的細節被大多數人忽略了。

Meta 向英偉達買的是目前的Blackwell 和未來的Vera Rubin;與AMD 的交易,買的是MI450 和未來的MI455X;向谷歌租的是當前的Ironwood TPU,計劃明年直接購買。

三家供應商,三套完全不同的硬體架構和軟體生態。

這意味著Meta 要在英偉達的CUDA、AMD 的ROCm 和谷歌的XLA/JAX 三套截然不同的底層生態中反覆橫跳。多供應商策略固然能分散供應鏈風險、壓低硬體採購溢價,但這將帶來指數級飆漲的工程複雜度。

這正是Meta 目前最致命的軟肋,要讓一個萬億參數的模型在這三套底層編程模型完全不同硬體上都能高效訓練,需要的不只是懂CUDA 的工程師,而是能從零搭建跨平台訓練框架的架構師。

這種人全世界可能不超過100 個。龐若鳴是其中之一。

花1000 億美元買進全球最複雜的硬體組合,同時卻在流失能駕馭這些硬體的大腦,這才是祖克柏這場豪賭中最魔幻的畫面。

祖克柏的賭局

把鏡頭拉遠一點看,祖克柏在過去18 個月對AI 的操作路徑,和他當年All In 元宇宙的節奏驚人地相似:

看到趨勢,重金投入,大舉招人,遇到挫折,策略急轉,再重金投入。

2021 到2023 年是元宇宙,結果每年虧上百億,最後股價從380 美元跌到88 美元。 2024 到2026 年是AI,同樣是不計代價地砸錢、頻繁的組織重組,同樣是「信我,我有vision」的敘事。

不同的是,這次AI 的風口確實比元宇宙實在許多。而Meta 有錢燒,其廣告業務產生了充沛的現金流,2025 年第四季Meta 營收599 億美元,較去年同期成長24%。

問題在於:錢能買到晶片,買到算力,甚至是工位坐著的人,但買不到留下來的人。

龐若鳴選擇了OpenAI,Russ Salakhutdinov 選擇了離開, LeCun 選擇了創業。

祖克柏現在的賭注是,只要買到足夠的晶片、蓋好夠大的資料中心、花足夠的錢,總能找到或培養出能用這些資源的人。

這個賭注可能成立。 Meta 畢竟是世界上最有錢的科技公司之一,超過1000 億美元的經營現金流是它最堅固的護城河。從OpenAI 到Anthropic、從谷歌到其他競爭對手,Meta 都在持續挖人。根據量子位元報道,Meta 超級智慧團隊44 人中,近40% 來自OpenAI。

但AI 競賽的殘酷之處在於,算力儲備、人才名單、模型表現都是是公開的,Llama 4 的benchmark 造假事件證明,在這個行業裡,你沒有辦法靠PPT 和公關來維持領先。

市場最終只認一樣東西:你的模型夠不夠好。

食物鏈的位置

AI 軍備競賽進入2026 年,食物鏈的排序已經初步清晰:

頂端是OpenAI 和Google。 OpenAI 有最強的模式、最大的用戶基數和最激進的融資。谷歌有自研晶片、自研模型以及自研雲端基礎設施的完整垂直整合。 Anthropic 緊跟在後,靠著Claude 模型的產品力和谷歌、亞馬遜的雙線算力供應,穩居第一梯隊。

Meta? 它砸了最多的錢、簽了最多的晶片合約、做了最頻繁的組織重組,但到目前為止,還沒有拿出一個能讓市場信服的前沿模型。

Meta 的AI 故事有點像2005 年的雅虎。當時雅虎也是網路最有錢的公司之一,也在瘋狂收購、砸錢,但就是做不出Google那樣的搜尋引擎。錢不是萬能的。祖克柏需要想清楚是,Meta 到底要在AI 上做什麼,而不是看到什麼熱就買什麼。

當然,寫Meta 的訃聞還為時過早。 35.8 億月活用戶、599 億美元的季度營收、全球最大的社交資料集,這些是任何競爭對手都難以複製的資產。

如果代號Avocado 的下一代模型能在2026 年如期交付並重返第一梯隊,祖克柏所有的砸錢與重組都會被包裝成「力挽狂瀾的戰略魄力」。但如果再次不如預期,那這1,350 億美元換來的,將只是一座座通電發熱的矽晶圓倉庫。

畢竟,矽谷的AI 軍備競賽從來不缺揮舞支票的超級買家。缺少的是,知道如何用這些算力煉出未來的人。

分享至:

作者:深潮TechFlow

本文為PANews入駐專欄作者的觀點,不代表PANews立場,不承擔法律責任。

文章及觀點也不構成投資意見

圖片來源:深潮TechFlow如有侵權,請聯絡作者刪除。

關注PANews官方賬號,一起穿越牛熊