撰文:許超
人工智慧基礎設施的供需矛盾正在全球頂級科技公司之間激化。據知情人士透露,谷歌約於今年3月告知Meta,無法滿足其全部Gemini算力需求,並對這家社群媒體巨頭實施了使用上限——即便是全球最大的AI服務商,也難以應對洶湧而來的算力需求。
據英國《金融時報》報導,上述限制至今仍未解除,已導致Meta多個內部AI項目遭到干擾和延誤。受此影響,Meta已要求員工提高AI算力使用效率,在內部推行對AI token的精打細算。谷歌與Meta均拒絕就此置評。
這一局面迫使谷歌加快擴容步伐。谷歌本月早些時候與伊隆·馬斯克旗下SpaceX簽訂了一份每月9.2億美元的算力租賃協議。谷歌執行長桑達爾·皮查伊在今年第一季財報會議上坦言:「近期我們在算力方面確實面臨制約,如果能夠滿足需求,雲端業務收入將會更高。」
Meta並非孤例。多位知情人士指出,其他谷歌企業客戶同樣受到程度不一的限制,而Meta因需求規模異常龐大受影響最深。這場風波折射出AI推理工作負載的爆炸式增長,已成為整個行業面臨的最大挑戰之一。
算力瓶頸持續承壓,大客戶首當其衝
儘管各大科技公司已在晶片、資料中心和電力供應上砸下數百億美元,AI算力供給仍難以追上需求增速。
谷歌第一季雲端業務收入首次突破200億美元,已簽署但尚未交付的雲端合約積壓量環比幾乎翻倍,超過4600億美元。皮查伊明確表示,算力制約在近期內仍將持續。
在此背景下,Meta受到的衝擊尤為突出。知情人士表示,正是Meta等大型企業客戶的高強度需求,直接推動谷歌加速尋求外部算力來源。隨著企業大規模部署聊天機器人、程式設計助手和AI智慧體,推理工作負載——即模型訓練完成後在實際應用中執行任務所消耗的算力——正成為行業的核心瓶頸。
Meta內部項目受阻,加速轉向自研模型
Meta在內部廣泛使用Gemini,涵蓋平台安全審核(包括識別詐騙內容、清除有害資訊)、客服及廣告輔助聊天機器人,以及部分內部工作流和程式碼開發,同時搭配使用Anthropic的Claude等其他模型。
據知情人士透露,Meta最初選擇Gemini,是因為其表現優於公司自研的Llama開源模型。然而隨著算力限制的收緊,Meta正加快向自研模型遷移。多位知情人士表示,Meta近期已開始優先推廣其新推出的Muse Spark模型,該模型被認為在性能上已能與Gemini相抗衡,有助於降低對外部模型的依賴。
Meta執行長馬克·祖克柏此前持續加大對AI人才和基礎設施的投入,致力於打造其所稱的「個人超級智慧」。與谷歌不同,Meta沒有雲端業務,正在加速自建資料中心體系,並承諾到2028年在美國累計投資6000億美元。
谷歌借道SpaceX擴容,行業尋求破局
面對算力壓力,谷歌本月與SpaceX簽署每月9.2億美元的算力租賃協議,以彌補基礎設施缺口。AI實驗室Anthropic上月也與SpaceX達成了類似協議。
谷歌對Meta採取限制措施一事,為外界提供了一個罕見窗口,得以窺見全球頂級AI服務商在算力分配上所面臨的真實壓力。當前,整個AI行業的基礎設施瓶頸正從訓練側蔓延至推理側,供需矛盾的化解仍有賴於新一輪大規模資本投入的落地兌現。

