200억 달러 규모의 두 건의 거래: 오픈AI와 엔비디아가 '추론 전쟁'을 벌이고 있다.

  • 2025년 12월, NVIDIA는 AI 칩 기업 Groq를 200억 달러에 인수하여 추론 능력을 강화했습니다.
  • 2026년 4월, OpenAI는 AI 칩 기업 Cerebras로부터 200억 달러 규모의 칩 구매를 발표했고, Cerebras는 같은 날 IPO를 신청하여 목표 가치는 350억 달러입니다.
  • 이는 AI 컴퓨팅이 트레이닝에서 추론으로 전환되는 추세를 반영하며, 2026년까지 추론이 AI 컴퓨팅 지출의 3분의 2를 차지할 것으로 예상됩니다.
  • NVIDIA의 GPU는 트레이닝에 최적화되어 있어 추론 효율이 낮아, 인수를 통해 기술 격차를 메꿉니다.
  • OpenAI는 Cerebras와의 거래에서 지분 취득과 자금 지원을 포함해 비-NVIDIA 추론 컴퓨팅력을 확보하며, 자체 ASIC 칩을 개발하여 자율성을 추구합니다.
  • Cerebras의 IPO는 AI 추론 인프라 통제권을 둘러싼 경쟁의 신호로, 시장은 성장 중이지만 위험도 존재합니다.
요약

작성자: 샤오피

2025년 12월, 엔비디아는 조용히 200억 달러를 들여 그로크(Groq)라는 AI 칩 회사를 인수했다.

2026년 4월 17일, 오픈AI는 또 다른 AI 칩 회사인 세레브라스(Cerebras)로부터 200억 달러 이상의 칩을 구매할 것이라고 발표했습니다. 같은 날, 세레브라스는 나스닥 상장을 공식 신청했으며, 목표 기업 가치는 350억 달러였습니다.

두 건의 지불 금액은 거의 동일했습니다. 하나는 인수 대금이었고, 다른 하나는 구매 대금이었습니다. 하나는 세계 최대 AI 칩 판매업체에서, 다른 하나는 세계 최대 AI 구매업체에서 이루어졌습니다.

이것들은 별개의 사건이 아니라, 동일한 전쟁 내에서 벌어지는 두 가지 대칭적인 행동입니다. 이 전장의 이름은 'AI 추론'입니다.

대부분의 사람들은 이 전쟁을 알아채지 못했습니다. 실리콘 밸리 엔지니어들 사이에서 재정 발표와 기술적 논의가 오가는 조용한 전쟁이기 때문입니다. 하지만 이 전쟁의 영향은 지난 2년간의 어떤 AI 출시 행사보다 더 심오할 수 있습니다. 역사상 최대 기술 시장이 될 것이 거의 확실한 시장의 주도권을 재편하고 있기 때문입니다.

추론이란 무엇이며, 왜 "훈련"은 2026년의 핵심 키워드가 아닌가요?

200억이라는 두 수치를 논하기 전에, 먼저 배경을 이해할 필요가 있습니다. 바로 AI 칩 경쟁의 초점이 바뀌고 있다는 점입니다.

학습과 추론은 AI 컴퓨팅 파워를 소비하는 두 단계입니다. 학습은 모델을 구축하는 단계로, 방대한 양의 데이터를 신경망에 입력하여 특정 기능을 학습시키는 과정입니다. 이 과정은 일반적으로 한 번만 수행되거나 주기적으로 업데이트됩니다. 추론은 모델을 사용하는 단계로, 사용자가 질문을 하고 ChatGPT가 답변을 제공할 때마다 추론 요청이 발생합니다.

2023년 전 세계 AI 컴퓨팅 파워 지출의 대부분은 학습에 사용되었으며, 추론은 부차적인 역할을 했습니다.

하지만 이 비율은 빠르게 역전되고 있습니다.

딜로이트와 CES 2026의 시장 조사 데이터에 따르면, 2025년에는 AI 컴퓨팅 파워 지출의 50%가 추론에 할애되었으며, 2026년에는 이 비율이 3분의 2까지 급증할 것으로 예상됩니다. 레노버 CEO 양위안칭은 CES에서 더욱 직설적으로 AI 지출 구조가 "학습 80% + 추론 20%"에서 "학습 20% + 추론 80%"로 완전히 뒤바뀔 것이라고 언급했습니다.

논리는 복잡하지 않습니다. 학습은 일회성 비용이지만, 추론은 지속적인 비용입니다. GPT-4는 한 번 학습되지만, 매일 수억 명의 사용자로부터 질문에 답해야 하며, 각 대화는 추론 요청입니다. 대규모 배포 후에는 추론에 드는 누적 비용이 학습 비용을 훨씬 초과하게 됩니다.

이것은 무엇을 의미할까요? 인공지능 산업에서 가장 수익성이 높은 부분이 "학습용 칩"에서 "추론용 칩"으로 이동하고 있다는 것을 의미합니다. 그리고 이 두 종류의 칩은 완전히 다른 아키텍처 설계가 필요합니다.

엔비디아의 문제점: 학습용으로 설계된 칩은 본질적으로 추론 능력이 떨어진다.

NVIDIA의 H100 및 H200은 학습용으로 설계된 강력한 그래픽 카드입니다. 이 제품들의 핵심 장점은 매우 높은 연산 처리량입니다. 학습에는 방대한 행렬에 대한 수많은 곱셈 연산이 필요한데, GPU는 이러한 "멀티코어 병렬 컴퓨팅"에 탁월합니다.

하지만 추론의 병목 현상은 계산 능력이 아니라 메모리 대역폭에 있습니다.

사용자가 질문을 제출하면, 칩은 답변을 생성하기 전에 전체 모델의 가중치를 메모리에서 연산 장치로 "이동"시켜야 합니다. 이 "이동" 과정이 추론 지연의 주요 원인입니다. NVIDIA의 GPU는 외부 고대역폭 메모리(HBM)를 사용하는데, 이 이동 단계에서 필연적으로 지연이 발생합니다. 초당 수천만 건의 요청을 처리하는 ChatGPT의 경우, 이러한 지연이 규모에 따라 누적되어 실제 성능 병목 현상을 초래합니다.

OpenAI의 내부 엔지니어들이 이 문제를 발견했을 당시, 그들은 코드 생성 도구인 Codex를 최적화하는 과정에서 매개변수를 어떻게 조정하더라도 응답 속도가 NVIDIA GPU 아키텍처에 의해 제한된다는 사실을 알아차렸습니다.

다시 말해, 엔비디아의 추론 능력 부족은 노력의 문제가 아니라 아키텍처의 문제입니다.

세레브라스의 WSE-3 칩은 완전히 새로운 접근 방식을 택했습니다. 웨이퍼 레벨 패키징이 필요할 정도로 거대한 이 칩(46,255제곱밀리미터, 사람 손보다 큼)에는 90만 개의 AI 코어와 44GB의 초고속 SRAM이 단일 실리콘 칩에 통합되었습니다. 메모리는 컴퓨팅 코어 바로 옆에 배치되어 "전송" 거리를 센티미터에서 마이크로미터로 단축했습니다. 그 결과, 추론 속도가 엔비디아의 H100보다 15~20배 빨라졌습니다.

엔비디아가 가만히 앉아만 있는 것은 아니라는 점에 주목할 필요가 있습니다. H100보다 추론 성능이 네 배 향상된 최신 블랙웰(B200) 아키텍처가 대규모로 배포되고 있습니다. 하지만 블랙웰은 끊임없이 변화하는 목표를 향해 나아가고 있습니다. 세레브라스 역시 동시에 기술을 발전시키고 있으며, 칩 시장의 경쟁은 더 이상 세레브라스에만 국한되지 않습니다.

엔비디아의 200억 달러 규모 인수 계약: 역사상 최대 규모 인수 계약의 배경이 된 확인서

2025년 12월 24일, 엔비디아는 역사상 최대 규모의 인수합병을 발표했습니다.

타겟은 Groq입니다.

Groq는 Cerebras의 경쟁사였으며, 추론에 최적화된 SRAM 아키텍처 칩인 LPU(언어 처리 장치)를 탑재했습니다. 이 LPU는 당시 공개된 리뷰에서 세계에서 가장 빠른 추론 칩 서비스였습니다. 엔비디아는 Groq의 핵심 기술과 창립자 조너선 로스를 비롯한 창립팀, 그리고 구글 TPU 팀의 최고 칩 엔지니어들을 인수하기 위해 200억 달러를 투자했습니다.

이번 인수는 엔비디아가 2019년 70억 달러에 멜라녹스를 인수한 이후 최대 규모이며, 회사 규모를 세 배로 늘릴 예정이다.

많은 분석가들은 이 투자의 금액 자체보다 그 이면에 담긴 메시지가 훨씬 더 중요하다고 믿습니다. 엔비디아는 자사의 추론 능력에 구조적인 격차가 있다고 판단하고 있으며, 이 격차를 메우기 위해 200억 달러를 투자할 만큼 충분히 크다고 생각하는 것입니다.

엔비디아가 자사의 GPU가 추론 성능에서 타의 추종을 불허한다고 진정으로 믿었다면 Groq를 인수할 필요가 없었을 것입니다. 이 인수는 본질적으로 200억 달러 규모의 기술 구매 계약과 다름없습니다. 즉, 추론 시나리오에서 SRAM 내장 아키텍처의 진정한 기술적 우위를 인정하고, 엔비디아의 기존 제품 라인으로는 이러한 우위를 자연스럽게 따라잡을 수 없다는 것을 시인하며, 자체적으로는 채울 수 없었던 기술적 격차를 최고가로 사들인 것입니다.

물론, 인수 후 엔비디아의 공식적인 설명은 달랐습니다. "Groq와의 긴밀한 통합을 통해 더욱 완벽한 추론 솔루션을 제공합니다." 기술적인 의미는 이렇습니다. "우리 솔루션만으로는 부족하다는 것을 깨닫고 다른 회사의 솔루션을 인수했다."

OpenAI의 200억 달러 투자: 칩 구매는 표면적인 것에 불과하며, 진정한 핵심은 지분 투자다.

자, 이제 OpenAI로 돌아가 봅시다.

2026년 1월, OpenAI와 Cerebras는 100억 달러 규모의 3년 컴퓨팅 파워 구매 계약을 체결했습니다. 당시 언론은 "OpenAI가 칩 공급업체를 다변화하고 있다"는 데 초점을 맞춰 이 계약의 중요성을 축소 보도했습니다.

하지만 4월 17일에 공개된 최신 정보는 이 문제의 본질을 근본적으로 바꿔놓았습니다.

첫째, 조달 금액이 100억에서 200억으로 두 배로 늘어났습니다.

둘째, OpenAI는 Cerebras의 워런트를 인수할 예정이며, 인수 규모가 커짐에 따라 Cerebras 총 발행 주식의 최대 10%까지 지분을 확보할 수 있습니다.

셋째, OpenAI는 Cerebras에 데이터 센터 건설 자금으로 10억 달러를 지원할 예정입니다. 다시 말해, OpenAI는 Cerebras가 공장을 짓도록 돕는 것입니다.

이 세 가지 세부 사항을 종합해 보면 완전히 다른 그림이 그려집니다. OpenAI는 단순히 칩을 구매하는 것이 아니라, 공급업체를 육성하고 있는 것입니다.

이러한 논리는 기술 역사에서 명확한 선례를 찾아볼 수 있습니다. 2006년 애플은 삼성과 협력하여 A 시리즈 칩을 맞춤 제작하기 시작했습니다. 처음에는 대규모 구매 계약이었지만, 애플이 참여를 확대하고 결국 자체 M 시리즈 칩을 개발하면서 공급망 통제권이 인텔과 삼성에서 애플로 완전히 넘어갔습니다. 오픈AI의 접근 방식도 이와 다소 유사하지만 중요한 차이점이 있습니다. 애플은 처음부터 칩 설계를 통제해 왔고, 오픈AI는 구매자로 남으며, 세레브라스는 기업공개(IPO) 이후 독립적으로 개발하여 더 많은 고객에게 서비스를 제공할 것입니다. 이러한 경로의 최종 결과는 오픈AI가 세레브라스를 완전히 장악하는 것이 아니라, 두 회사 간에 긴밀하게 상호 의존적인 생태계가 구축되는 것일 가능성이 더 높습니다.

한편으로, 오픈AI는 세레브라스에 200억 달러를 투자하고 지분을 확보하여 엔비디아 외의 추론 컴퓨팅 파워를 안정적으로 공급받고 있습니다. 다른 한편으로, 오픈AI는 브로드컴과 협력하여 자체 ASIC 칩을 개발하고 있으며, 2026년 말까지 양산에 들어갈 것으로 예상됩니다. 이러한 두 가지 전략을 통해 컴퓨팅 파워의 자급자족을 달성하고자 합니다.

세레브라스가 오늘 기업공개(IPO)를 했는데, 뭘 사셨나요?

세레브라스는 4월 17일 나스닥 상장을 공식 신청했으며, 목표 기업 가치는 350억 달러, 조달액은 30억 달러로 설정했습니다.

이번 기업 가치 평가는 2025년 9월 당시 81억 달러였던 기업 가치보다 4배 이상 증가한 수치입니다. 이 회사는 올해 2월에 새로운 자금 조달 라운드를 완료했으며, 당시 기업 가치는 이미 230억 달러까지 상승하여 IPO 목표치인 350억 달러 대비 52%의 프리미엄을 기록했습니다.

세레브라스의 역사를 아는 사람들은 이번이 두 번째 기업공개(IPO) 시도라는 것을 알고 있을 것입니다. 첫 번째 IPO는 2024년에 추진되었지만, 핵심 고객인 G42(아랍에미리트 국영 기술 투자 펀드)가 그해 매출의 83%에서 97%를 차지하는 바람에 철회될 수밖에 없었습니다. 미국 외국인투자심의위원회(CFIUS)가 국가 안보를 이유로 개입하면서 IPO는 취소되었습니다.

이번에는 G42가 주주 명단에서 사라지고 OpenAI가 그 자리를 대신했습니다.

다시 말해, 세레브라스의 고객 집중이라는 구조적 문제는 근본적으로 해결되지 않았습니다. 주요 고객의 이름은 바뀌었지만, 그들에 대한 의존도는 여전히 남아 있습니다. 투자자들이 판단해야 할 것은 이 주요 고객이 더 나은지, 아니면 더 나쁜지입니다. 신용도 측면에서 볼 때, 오픈아이디는 G42보다 분명히 우월합니다. 전략적 관점에서 볼 때, 오픈아이디는 세레브라스의 경쟁사들을 육성하는 인큐베이터 역할도 하고 ​​있습니다. 자체 개발한 ASIC이 성숙 단계에 접어들면 세레브라스에게 실질적인 대체재가 될 것입니다.

공정하게 말하자면, 세레브라스 역시 고객 기반을 적극적으로 확장하고 있으며, 향후 기업공개(IPO)에서는 더욱 다양화된 수익원을 제시하여 시장 집중도를 높일 것으로 예상됩니다. 하지만 이 질문에 대한 답은 오픈아이(OpenAI)가 자체 개발한 칩이 양산에 들어갈 때까지는 알 수 없을 것입니다.

세레브라스 주식을 매수한다는 것은 오픈아이얼이 앞으로도 세레브라스를 선택할 것이고, 오픈아이얼이 자체 개발한 ASIC이 예정보다 일찍 출시되지 않을 것이라는 데에 베팅하는 것과 같습니다. 하지만 이 두 가지 모두 확실한 것은 아닙니다.

물론 낙관적인 주장도 타당합니다. 추론 시장이 예상대로 성장한다면 세레브라스가 차지하는 비중은 작더라도 상당할 것입니다. 문제는 세레브라스의 성공 가능성이 있는지 여부가 아니라, 350억 달러라는 기업 가치가 가장 낙관적인 시나리오를 반영한 ​​것인지 여부입니다.

200억이라는 수치는 2025년 말과 2026년 4월 사이에 대칭적으로 나타납니다.

세계적인 AI 칩 판매업체가 추론 시장에서 경쟁업체의 기술을 인수했습니다.

세계 최대 AI 구매업체의 자회사가 추론 시장에서 엔비디아에 도전할 기업을 육성했습니다.

엔비디아의 200억 달러 투자는 방어적인 전략입니다. 가장 비싼 가격을 제시하여 자사 스스로는 메울 수 없었던 기술적 격차를 해소하려는 것입니다.

OpenAI의 200억 달러 투자는 공세적인 행보입니다. 엔비디아에 의존하지 않는 추론 고속도로를 구축하기 위해 막대한 자금을 쏟아붓는 동시에, 그 고속도로에 있는 통행료 징수소에 대한 대가로 주식 옵션을 확보하는 셈입니다.

이 전쟁은 총성 없이 벌어지지만, 자금의 흐름은 결코 거짓말을 하지 않습니다. 어떤 AI 관련 기자회견보다도 두 가지 수치가 더 명확하게 말해줍니다. 바로 AI 추론 인프라의 통제권을 둘러싼 치열한 경쟁이 벌어지고 있다는 것입니다. 그리고 이 시장은 2026년까지 업계 전체 컴퓨팅 파워 지출의 3분의 2를 차지할 것입니다.

세레브라스의 기업공개(IPO)가 이 싸움의 시작점이었다.

공유하기:

작성자: 华尔街见闻

이 글은 PANews 입주 칼럼니스트의 관점으로, PANews의 입장을 대표하지 않으며 법적 책임을 지지 않습니다.

글 및 관점은 투자 조언을 구성하지 않습니다

이미지 출처: 华尔街见闻. 권리 침해가 있을 경우 저자에게 삭제를 요청해 주세요.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
PANews APP
바이낸스 공동 CEO가 ZachXBT의 질문에 답변했습니다: RAVE 토큰과 관련된 내부자 거래 의혹에 대한 조사가 시작되었습니다.
PANews 속보