글: 쉬차오
인공지능 인프라의 수급 불균형이 전 세계 주요 기술 기업들 간에 격화되고 있다. 소식통에 따르면 구글은 올해 3월 무렵 메타에 모든 Gemini 컴퓨팅 수요를 충족할 수 없다고 통보하고 이 소셜미디어 거대 기업에 사용량 상한선을 설정했다. 세계 최대 AI 서비스 제공업체조차 폭증하는 컴퓨팅 수요를 감당하기 어려운 상황이다.
영국 파이낸셜타임스(FT) 보도에 따르면, 이 제한은 현재까지도 풀리지 않아 메타의 여러 내부 AI 프로젝트에 차질과 지연을 초래하고 있다. 이 영향으로 메타는 직원들에게 AI 컴퓨팅 사용 효율을 높이고 내부적으로 AI 토큰을 알뜰히 운영하도록 요구했다. 구글과 메타 모두 이에 대한 논평을 거부했다.
이러한 상황은 구글이 용량 확충에 속도를 내도록 압박하고 있다. 구글은 이달 초 일론 머스크가 이끄는 스페이스X와 매월 9억2천만 달러 규모의 컴퓨팅 임대 계약을 체결했다. 구글 CEO 순다르 피차이는 올해 1분기 실적 발표에서 "최근 컴퓨팅 측면에서 실제로 제약에 직면해 있으며, 수요를 충족할 수 있다면 클라우드 사업 매출이 더 높을 것"이라고 솔직히 밝혔다.
메타만 그런 것이 아니다. 여러 소식통은 다른 구글 기업 고객들도 정도의 차이는 있지만 제한을 받고 있으며, 메타는 수요 규모가 유독 방대해 가장 큰 영향을 받고 있다고 전했다. 이번 소동은 AI 추론 워크로드의 폭발적 증가가 업계 전반이 직면한 최대 난제 중 하나로 자리 잡았음을 보여준다.
컴퓨팅 병목 지속, 대형 고객 직격탄
주요 기술 기업들이 칩, 데이터센터, 전력 공급에 수백억 달러를 쏟아부었음에도 불구하고, AI 컴퓨팅 공급은 여전히 수요 증가 속도를 따라잡지 못하고 있다.
구글의 1분기 클라우드 사업 매출은 처음으로 200억 달러를 돌파했으며, 계약은 체결됐지만 아직 이행되지 않은 클라우드 계약 잔량은 전분기 대비 거의 두 배로 늘어 4,600억 달러를 넘어섰다. 피차이는 컴퓨팅 제약이 단기적으로 계속될 것임을 분명히 했다.
이런 배경 속에서 메타가 받은 충격은 특히 두드러진다. 소식통에 따르면 메타 등 대형 기업 고객의 고강도 수요가 구글이 외부 컴퓨팅 자원 확보에 속도를 내도록 직접 촉발했다고 한다. 기업들이 챗봇, 코딩 도우미, AI 에이전트를 대규모로 배포하면서 추론 워크로드, 즉 모델 학습 후 실제 애플리케이션에서 작업을 수행하는 데 소모되는 컴퓨팅 자원이 업계의 핵심 병목으로 떠오르고 있다.
메타 내부 프로젝트 차질, 자체 모델로 전환 가속
메타는 내부적으로 Gemini를 광범위하게 사용하고 있으며, 여기에는 플랫폼 안전 심사(사기 콘텐츠 식별, 유해 정보 제거 포함), 고객 서비스 및 광고 지원 챗봇, 일부 내부 워크플로우와 코드 개발 등이 포함되고, Anthropic의 Claude 등 다른 모델도 함께 활용하고 있다.
소식통에 따르면 메타는 처음에 Gemini가 자사의 자체 개발 오픈소스 모델인 Llama보다 성능이 뛰어나기 때문에 선택했다. 그러나 컴퓨팅 제한이 강화되면서 메타는 자체 개발 모델로의 전환 속도를 높이고 있다. 복수의 소식통은 메타가 최근 새로 출시한 Muse Spark 모델을 우선적으로 확대 적용하기 시작했으며, 이 모델은 성능 면에서 Gemini에 필적할 수 있는 것으로 평가되어 외부 모델 의존도를 낮추는 데 도움이 된다고 전했다.
메타 CEO 마크 저커버그는 앞서 '개인용 슈퍼 인텔리전스'라고 부르는 것을 구축하기 위해 AI 인재와 인프라에 대한 투자를 지속적으로 확대해 왔다. 구글과 달리 메타는 클라우드 사업이 없으며, 자체 데이터센터 체계 구축에 속도를 내고 2028년까지 미국에 총 6,000억 달러를 투자하겠다고 약속했다.
구글, 스페이스X 통해 용량 확충… 업계, 돌파구 모색
컴퓨팅 압박에 직면한 구글은 이달 스페이스X와 월 9억2천만 달러 규모의 컴퓨팅 임대 계약을 체결해 인프라 공백을 메우고 있다. AI 연구소 Anthropic도 지난달 스페이스X와 유사한 계약을 맺었다.
구글이 메타에 제한 조치를 취한 사실은 글로벌 최상위 AI 서비스 제공업체가 컴퓨팅 자원 배분에서 직면한 실제 압박을 엿볼 수 있는 드문 기회를 외부에 제공했다. 현재 AI 산업 전체의 인프라 병목 현상은 학습 단계에서 추론 단계로 번지고 있으며, 수급 불균형 해소는 새로운 대규모 자본 투입이 현실화되는 데 달려 있다.

