算力告急：谷歌悄然對Meta實施Gemini使用上限

撰文：許超

人工智慧基礎設施的供需矛盾正在全球頂級科技公司之間激化。據知情人士透露，谷歌約於今年3月告知Meta，無法滿足其全部Gemini算力需求，並對這家社群媒體巨頭實施了使用上限——即便是全球最大的AI服務商，也難以應對洶湧而來的算力需求。

據英國《金融時報》報導，上述限制至今仍未解除，已導致Meta多個內部AI項目遭到干擾和延誤。受此影響，Meta已要求員工提高AI算力使用效率，在內部推行對AI token的精打細算。谷歌與Meta均拒絕就此置評。

這一局面迫使谷歌加快擴容步伐。谷歌本月早些時候與伊隆·馬斯克旗下SpaceX簽訂了一份每月9.2億美元的算力租賃協議。谷歌執行長桑達爾·皮查伊在今年第一季財報會議上坦言：「近期我們在算力方面確實面臨制約，如果能夠滿足需求，雲端業務收入將會更高。」

Meta並非孤例。多位知情人士指出，其他谷歌企業客戶同樣受到程度不一的限制，而Meta因需求規模異常龐大受影響最深。這場風波折射出AI推理工作負載的爆炸式增長，已成為整個行業面臨的最大挑戰之一。

算力瓶頸持續承壓，大客戶首當其衝

儘管各大科技公司已在晶片、資料中心和電力供應上砸下數百億美元，AI算力供給仍難以追上需求增速。

谷歌第一季雲端業務收入首次突破200億美元，已簽署但尚未交付的雲端合約積壓量環比幾乎翻倍，超過4600億美元。皮查伊明確表示，算力制約在近期內仍將持續。

在此背景下，Meta受到的衝擊尤為突出。知情人士表示，正是Meta等大型企業客戶的高強度需求，直接推動谷歌加速尋求外部算力來源。隨著企業大規模部署聊天機器人、程式設計助手和AI智慧體，推理工作負載——即模型訓練完成後在實際應用中執行任務所消耗的算力——正成為行業的核心瓶頸。

Meta內部項目受阻，加速轉向自研模型

Meta在內部廣泛使用Gemini，涵蓋平台安全審核（包括識別詐騙內容、清除有害資訊）、客服及廣告輔助聊天機器人，以及部分內部工作流和程式碼開發，同時搭配使用Anthropic的Claude等其他模型。

據知情人士透露，Meta最初選擇Gemini，是因為其表現優於公司自研的Llama開源模型。然而隨著算力限制的收緊，Meta正加快向自研模型遷移。多位知情人士表示，Meta近期已開始優先推廣其新推出的Muse Spark模型，該模型被認為在性能上已能與Gemini相抗衡，有助於降低對外部模型的依賴。

Meta執行長馬克·祖克柏此前持續加大對AI人才和基礎設施的投入，致力於打造其所稱的「個人超級智慧」。與谷歌不同，Meta沒有雲端業務，正在加速自建資料中心體系，並承諾到2028年在美國累計投資6000億美元。

谷歌借道SpaceX擴容，行業尋求破局

面對算力壓力，谷歌本月與SpaceX簽署每月9.2億美元的算力租賃協議，以彌補基礎設施缺口。AI實驗室Anthropic上月也與SpaceX達成了類似協議。

谷歌對Meta採取限制措施一事，為外界提供了一個罕見窗口，得以窺見全球頂級AI服務商在算力分配上所面臨的真實壓力。當前，整個AI行業的基礎設施瓶頸正從訓練側蔓延至推理側，供需矛盾的化解仍有賴於新一輪大規模資本投入的落地兌現。