지난 2년간 PC 제조업체들은 "AI PC"를 홍보할 때 NPU 연산 능력을 반복적으로 언급해 왔습니다. 하지만 인텔의 루나 레이크(45 TOPS)든 AMD의 스트릭스 포인트(50 TOPS)든, 그 성능은 여전히 비교적 평범한 수준에 머물러 있습니다. 배경 흐림 처리, 음성 잡음 제거, 소규모 엣지 모델 실행 정도는 가능하지만, 그 이상은 기대하기 어렵습니다.
5월 31일, NVIDIA는 GTC 2026에서 RTX Spark 슈퍼칩을 공개하며 처리 능력을 1페타플롭, 즉 1000 TOPS까지 끌어올렸습니다. 이는 30%나 50% 향상이 아니라, 한 자릿수 이상의 도약을 의미합니다.
이 행사에서는 몇 가지 다른 발표도 있었습니다. 마이크로소프트는 RTX Spark와 연계하여 윈도우의 기본 보안 메커니즘을 업그레이드하고 NVIDIA의 오픈 소스 샌드박스 런타임인 OpenShell을 윈도우 플랫폼에 도입했습니다. 어도비는 RTX Spark의 통합 메모리 아키텍처에 맞춰 포토샵과 프리미어를 완전히 새롭게 재설계했다고 발표했습니다. 또한, 최초로 6개의 OEM 업체가 이 칩을 탑재한 얇고 가벼운 노트북과 소형 데스크톱을 올가을에 출시할 것이라고 밝혔습니다.
엔비디아가 올해 GTC에서 한 일은 새로운 칩을 출시하는 것이 아니었습니다. "개인용 AI 컴퓨터"라는 범주에 대한 새로운 하드웨어 표준을 정립하려는 시도였습니다.

GPU가 PC의 핵심 부품이 될 때
먼저 칩 자체를 살펴보겠습니다. NVIDIA가 GTC에서 공개한 자료에 따르면, RTX Spark는 6144개의 CUDA 코어를 갖춘 Blackwell 아키텍처 GPU와 MediaTek과 공동 설계한 20코어 Arm 아키텍처 Grace CPU를 통합하고 TSMC의 3nm 공정을 사용합니다. 핵심적인 변화는 메모리 아키텍처에 있습니다. 최대 128GB의 통합 메모리를 통해 CPU와 GPU가 동일한 메모리 풀을 공유하므로 두 구성 요소 간에 데이터를 주고받을 필요가 없습니다.
이는 과거 PC의 아키텍처 논리와는 정반대입니다.
기존 PC의 기본 구조는 "x86 CPU를 주 프로세서로, 외장형 GPU를 선택적 액세서리로 사용하는 것"입니다. 최근 AI PC라는 개념이 등장했지만, 인텔과 AMD는 AI 가속을 위한 추가 모듈로 NPU를 CPU에 통합하는 방식을 고수하고 있으며, 그 연산 능력은 일반적으로 40~50 TOPS 정도입니다. GPU는 여전히 "외부" 구성 요소로 남아 있습니다.
RTX Spark는 전력 배분 방식을 완전히 바꿔놓았습니다. 이 SoC는 GPU를 핵심으로, CPU는 보조적인 역할을 하도록 설계했습니다. NVIDIA는 RTX Spark의 AI 컴퓨팅 성능이 1페타플롭 FP4(초당 1000 TOPS)에 달한다고 주장하는데, 이는 이전 세대 AI PC에 탑재된 NPU보다 20배 이상 뛰어난 성능입니다. 이는 단순히 한 분야의 가속화를 넘어, 완전히 새로운 시대의 시작을 알리는 것입니다.
OEM 업체들의 신속한 대응이 이러한 평가를 뒷받침합니다. 엔비디아의 공식 발표와 이후 디지타임즈의 보도에 따르면, ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI는 올가을 RTX Spark를 탑재한 얇고 가벼운 노트북과 소형 데스크톱을 출시할 예정이며, 에이서와 기가바이트도 뒤따를 것으로 보입니다. 거의 모든 주요 윈도우 PC 브랜드가 이 경쟁에 뛰어들었습니다.

RTX Spark는 완전히 새로운 제품이 아닙니다. 2025년 초, 동일한 Blackwell 및 Grace 코어 칩이 Project DIGITS와 DGX Spark라는 이름으로 등장했는데, 당시에는 개발자를 위한 리눅스 데스크톱 슈퍼컴퓨터로, 크기는 소형 데스크톱 컴퓨터와 비슷했습니다. 1년 후, 이 아키텍처는 얇고 가벼운 노트북의 열 용량에 맞춰 압축되었고, 운영체제는 리눅스에서 윈도우로 변경되었으며, 대상 사용자층은 AI 개발자에서 일반 소비자 및 기업 사용자까지 확대되었습니다. GTC 2026에서 공개된 소비자용 제품 중 가장 주목할 만한 변화는 바로 이것입니다. 엔비디아는 개발자용 제품이 아닌, 소비자 시장 진출의 문을 열었습니다.
120B 모델이면 지역 사용에 충분할까요?
궁극적으로 컴퓨팅 성능과 메모리에 대한 수치는 다음 질문에 답해야 합니다. 무엇을 할 수 있을까요?
NVIDIA는 출시 행사에서 RTX Spark가 1200억 개의 파라미터를 가진 대규모 모델을 로컬에서 실행할 수 있으며, 컨텍스트 윈도우는 수백만 개의 토큰에 달한다고 밝혔습니다. 1200억이라는 숫자는 어느 정도 의미일까요? 참고로, 현재 일반 소비자용 하드웨어에서 로컬 모델을 실행하는 일반적인 방식은 24GB VRAM을 탑재한 RTX 4090으로 양자화 및 압축을 통해 300억~400억 개의 파라미터를 가진 모델을 실행하는 것입니다. 약 90억 개의 파라미터를 가진 소규모 모델은 일반 소비자용 그래픽 카드에서도 빠르게 실행될 수 있습니다. 90억에서 1200억으로의 도약은 "충분한" 엣지 AI의 기준을 새롭게 정의합니다.
이 모든 것을 위해서는 128GB의 통합 메모리가 필수적입니다. 기존 PC 아키텍처에서는 CPU가 자체 시스템 메모리를, GPU가 자체 비디오 메모리를 가지고 있으며, 이 둘 사이에는 물리적인 경계가 있습니다. 비디오 메모리 용량을 초과하는 대형 모델은 아예 실행되지 않거나, 복잡한 모델 분할 및 메모리 스와핑이 필요하여 속도가 급격히 저하됩니다. 통합 메모리 아키텍처는 이러한 병목 현상을 해결합니다. 모델 데이터는 CPU와 GPU 모두가 접근할 수 있는 128GB 공유 메모리 풀에 직접 저장됩니다. 애플은 애플 실리콘을 통해 이 기술의 소비자급 실현 가능성을 최초로 입증했으며, 이제 엔비디아가 윈도우 진영에 이 기술을 도입하고 있습니다.
NVIDIA는 대규모 모델 추론 외에도 12K 비디오 편집, 90GB 이상의 3D 장면 렌더링, 1440p 해상도에서 100fps 이상의 레이 트레이싱 게임 등 다양한 활용 사례를 제시했습니다. 이러한 시나리오들은 모두 한 번에 엄청난 양의 데이터를 처리해야 한다는 공통점을 가지고 있어, 기존 PC로는 몇 배의 처리 시간이 필요하거나 아예 실행할 수 없는 경우가 많습니다.
"운영 지원"과 "원활한 사용성" 사이에는 간극이 존재합니다. NVIDIA는 RTX Spark의 120B 모델에 대한 실제 추론 속도 데이터를 공개하지 않았으며, 수백만 개의 토큰이 있는 시나리오에서의 첫 번째 토큰 지연 시간 데이터도 제공하지 않았습니다. 긴 컨텍스트에서 추론 속도를 결정하는 핵심 지표는 메모리 대역폭입니다. 참고로, GB10 코어를 사용하는 DGX Spark의 측정된 메모리 대역폭은 약 301GB/s입니다. 이 대역폭은 120B 모델을 실행하기에는 충분하지만, 수백만 개의 토큰이 있는 컨텍스트 창을 처리할 경우 사용자는 첫 번째 출력 토큰을 보기까지 몇 초를 기다려야 할 수 있습니다. RTX Spark 노트북 버전의 실제 대역폭은 전력 소비 제한으로 인해 조정될 수 있습니다.
AI 에이전트에 안전망을 추가하세요
컴퓨팅 성능 외에도 또 다른 중요한 발표는 NVIDIA와 Microsoft 간의 시스템 수준 협력이었습니다. 이는 GTC 2026 소비자 부문 발표에서 가장 쉽게 간과될 수 있지만 가장 큰 영향을 미치는 측면일 것입니다.
120B 모델을 실행할 수 있는 컴퓨터를 데스크톱을 자율적으로 조작하고, 버튼을 클릭하고, 파일을 읽고 쓸 수 있는 AI 에이전트에 제공하면 보안 위험은 더 이상 "데이터 손실 여부" 수준이 아니라 "에이전트가 원치 않는 작업을 수행할 가능성" 수준으로 바뀝니다. 이 문제가 해결되지 않는 한 기업은 직원들에게 이러한 장치를 배포할 수 없습니다.
마이크로소프트와 엔비디아는 이중 방어 체계를 제안했습니다. 첫째, 마이크로소프트는 윈도우의 기본 보안 메커니즘을 강화하여 운영체제 수준에서 AI 에이전트의 동작을 모니터링하고 제약할 수 있도록 했습니다. 둘째, 엔비디아는 윈도우 플랫폼에 OpenShell 런타임을 공식 도입했습니다. 엔비디아의 공식 문서에 따르면, OpenShell은 커널 수준의 격리를 제공하는 오픈 소스 샌드박스 런타임입니다. AI 에이전트를 위한 제어 가능한 운영 범위를 정의하여, 에이전트가 해당 범위 내에서 자율적으로 작업을 실행할 수 있도록 하지만, 핵심 시스템 파일, 네트워크 연결 또는 민감한 사용자 데이터에 접근하는 것을 엄격하게 제한하는 권한을 부여합니다.
이러한 조합이 기업 조달에 미치는 중요성은 분명합니다. 이전에는 "로컬 AI 에이전트"라는 개념이 기술 시연 단계에 머물러 있었습니다. 하드웨어는 작동했지만 보안 프레임워크는 미비했습니다. 어떤 기업 IT 부서도 이러한 상태의 장치를 조달 목록에 포함시키는 것을 꺼렸습니다. 엔비디아와 마이크로소프트는 하드웨어와 애플리케이션 사이에 표준화된 격리 계층을 구축하여 "사용 가능"한 상태를 "관리 가능"한 상태로 탈바꿈시켰습니다.
OpenShell 자체의 성능 오버헤드는 관찰해야 할 변수입니다. 샌드박스 격리는 일반적으로 성능 저하를 초래하지만, NVIDIA는 추론 속도나 시스템 응답성에 미치는 구체적인 영향에 대한 데이터를 아직 공개하지 않았습니다. 기업 IT 관리 인터페이스의 배포 복잡성과 기존 보안 정책과의 호환성은 OEM 장치가 시장에 출시된 후에야 검증될 수 있는 실질적인 문제입니다.
어도비는 왜 "처음부터 다시 만들겠다"는 의향이 있는 걸까요?
소프트웨어 공급업체의 협력 수준은 새로운 하드웨어 플랫폼이 시장에 자리 잡을 수 있을지 여부를 가늠하는 중요한 지표가 되는 경우가 많습니다.
GTC에서 어도비가 발표한 내용은 이번 릴리스에서 가장 중요한 소프트웨어 관련 소식이었습니다. NVIDIA 공식 블로그와 어도비 임원진의 확인에 따르면, 어도비는 RTX Spark의 통합 메모리 아키텍처에 맞춰 포토샵과 프리미어를 근본적으로 재설계했으며, 이를 통해 AI 및 그래픽 처리 성능이 최대 2배 향상되었다고 합니다.
"기저 수준 재구성"은 단순히 플러그인을 추가하거나 적응 레이어를 생성하는 것과는 다릅니다. 기존 PC에서는 CPU와 GPU가 각각 자체 메모리 공간을 가지고 있습니다. 매우 큰 PSD 파일이나 8K 비디오 타임라인을 처리할 때, 데이터는 두 메모리 세트 사이에서 반복적으로 이동해야 하는데, 이는 성능 저하의 주요 원인입니다. RTX Spark의 통합 메모리는 CPU와 GPU가 동일한 128GB 공간을 직접 공유할 수 있도록 합니다. 이러한 구조적 변화는 전문 크리에이터의 워크플로에 실질적인 가치를 제공합니다. Adobe가 이를 위해 기본 코드를 수정하기로 결정한 것은 이러한 아키텍처 방향이 일회성 마케팅 전략이 아니라는 점을 인식하고 있음을 보여줍니다.
하지만 엔비디아와 어도비 모두 이 "2배 속도 향상"에 대한 벤치마크 결과를 공개하지 않았습니다. 최신 x86 프로세서와 외장 그래픽 카드를 비교한 것인지, 아니면 이전 세대 AI PC의 NPU 솔루션과 비교한 것인지 불분명합니다. 결과는 극명하게 다릅니다. 벤치마크 조건이 공개될 때까지 이 수치의 신뢰성은 의심스럽습니다.
블랙매직 디자인, 컴피UI, llama.cpp, OTOY 및 여러 게임 개발사들도 지원을 발표했습니다. 특히 컴피UI와 llama.cpp의 지원은 주목할 만한데, 이들은 현재 네이티브 AI 워크플로우에서 가장 활발하게 활동하는 오픈 소스 도구 개발사 중 하나이기 때문입니다. 개발자 커뮤니티의 초기 지원은 주요 기업의 약속보다 플랫폼 생태계의 잠재력을 더 정확하게 보여주는 경우가 많습니다.
엔비디아는 CUDA 생태계와 통합 메모리 아키텍처를 활용하여 윈도우 진영에서 애플이 제공하는 것과 유사한 통합 하드웨어 및 소프트웨어 환경을 구축하고 있습니다. 차이점은 애플은 자체적인 방화벽을 구축한 반면, 엔비디아는 마이크로소프트와 ISV(독립 소프트웨어 공급업체)들을 설득하여 함께 구축해야 한다는 점입니다. 어도비가 처음부터 이러한 노력을 기울이겠다는 의지를 보인 것은 적어도 이 벽의 첫 번째 벽돌이 놓였다는 것을 보여줍니다.
서류상의 사양을 넘어서
이제 가장 현실적인 질문으로 돌아가 보겠습니다. 이러한 기기들을 실제로 구매할 수 있을까요? 그리고 구매 후에는 어떤 경험을 하게 될까요?
엔비디아가 공개한 정보에 따르면, RTX Spark를 탑재한 첫 번째 기기들은 올가을 출시될 예정이며, ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI 등의 제조사에서 얇고 가벼운 노트북과 소형 데스크톱을 선보일 예정입니다. Acer와 Gigabyte 모델은 추후 출시될 예정입니다. 모든 OEM 제조사의 구체적인 가격 및 정확한 출시일은 아직 발표되지 않았습니다.
가격보다 더 중요한 것은 물리적 차원에서 해결해야 할 여러 가지 미지수입니다. 1페타플롭의 연산 능력을 가진 칩을 얇고 가벼운 노트북에 탑재할 때 전력 소비와 발열 사이의 균형을 어떻게 맞출 것인가? RTX Spark는 일반적인 사무 작업에서 어떤 성능을 보여줄까? AI를 사용하지 않는 시나리오에서 배터리 수명은 어떨까? 128GB 통합 메모리의 실제 대역폭은 전력 소비 제한으로 인해 노트북 폼팩터에서 크게 줄어들지는 않을까?
이러한 문제들이 바로 산업화의 진정한 시험대입니다. 엔지니어링 프로토타입에서 칩의 최대 컴퓨팅 성능과 소비자가 하루 8시간 동안 실제로 사용할 때의 성능은 종종 차이가 있습니다. 엔비디아는 출시 행사에서 RTX Spark의 에너지 효율성을 강조했지만, 구체적인 TDP 값이나 배터리 수명 데이터는 제공하지 않았습니다.
PC 산업 지형의 관점에서 볼 때, RTX Spark의 등장은 새로운 분업의 형성을 의미합니다. 지난 30년간 PC 시장의 핵심 칩 성능은 x86 프로세서 제조업체들이 장악해 왔습니다. GPU 제조업체들의 중요성이 점점 커지고 있기는 하지만, 그들은 항상 "마더보드에 장착되는 부품"으로 여겨져 왔습니다. 엔비디아의 최신 제품은 CPU부터 GPU, 메모리 컨트롤러까지 모든 것을 통합한 완벽한 SoC이며, Arm 아키텍처 CPU 부분은 미디어텍이 설계했습니다. PC 산업의 권력 구조는 "x86 CPU에 선택적으로 GPU를 추가하는 방식"에서 "GPU 중심의 SoC 플랫폼"으로 변화하고 있습니다.
이러한 변화는 하루아침에 일어나지 않을 것입니다. OEM의 가격 전략, 실제 제품의 에너지 효율성, ISV 소프트웨어 적용 진행 상황, 그리고 기업 고객의 구매 검증 주기 등 각 요소가 RTX Spark가 PC 업계의 새로운 기준이 될지, 아니면 그저 화려하지만 결국 실망스러운 기술 시연에 그칠지를 결정할 것입니다. 그 답은 적어도 올가을이 되어야 알 수 있을 것입니다.




