젠슨 황은 다보스 포럼에서 정확히 무슨 말을 했나요?
겉으로는 로봇을 파는 것처럼 보였지만, 실제로는 대담한 '자기 혁명'을 벌이고 있었다. 단 한 마디로 "그래픽 카드 쌓기"라는 구시대를 끝냈을 뿐만 아니라, 뜻밖에도 암호화폐 업계에 일생일대의 진입 기회를 제공했다.
어제 다보스 포럼에서 황은 AI 응용 분야가 폭발적인 성장을 경험하고 있으며, 컴퓨팅 파워에 대한 수요가 "학습" 측면에서 "추론" 측면 및 "물리적 AI" 측면으로 이동할 것이라고 지적했습니다.
정말 흥미롭네요.
AI 1.0 시대의 '컴퓨팅 파워 경쟁'에서 최대 승자인 NVIDIA는 이제 '추론'과 '물리적 AI'로의 전환을 적극적으로 발표하고 있는데, 이는 사실상 매우 명확한 신호를 보내는 것입니다. 즉, GPU를 쌓아 대규모 모델을 학습시키는 '무차별 대입으로 기적을 행하는' 시대는 끝났고, 미래의 AI 경쟁은 응용 시나리오 측면에서 '응용이 왕'이라는 원칙에 따라 좌우될 것이라는 의미입니다.
다시 말해, 물리적 AI는 생성적 AI의 후반부입니다.
LLM은 지난 수십 년간 인간이 인터넷에 축적해 온 모든 데이터를 읽었음에도 불구하고, 여전히 인간처럼 병뚜껑을 여는 방법을 알지 못합니다. 물리적 AI는 인공지능의 한계를 넘어 "지식과 행동의 통합"이라는 문제를 해결하는 것을 목표로 합니다.
물리적 AI는 원격 클라우드 서버의 "긴 반응 시간"에 의존할 수 없기 때문입니다. 논리는 간단합니다. ChatGPT가 텍스트를 생성하는 데 1초 정도 느리더라도 사용자는 단지 지연을 느낄 뿐입니다. 하지만 이족 보행 로봇이 네트워크 지연으로 인해 1초 느려지면 계단에서 넘어질 수도 있습니다.
하지만 물리적 AI는 생성형 AI의 연장선처럼 보이지만, 실제로는 완전히 다른 세 가지 새로운 과제에 직면해 있습니다.
1) 공간 지능: 인공지능이 3차원 세계를 이해할 수 있도록 하는 기술.
리페이페이 교수는 공간 지능이 인공지능 진화의 다음 북극성이라고 주장한 바 있습니다. 로봇이 움직이려면 먼저 주변 환경을 "이해"해야 합니다. 이는 단순히 "이것은 의자다"라고 인식하는 것이 아니라, "3차원 공간에서 이 의자의 위치와 구조, 그리고 이를 움직이기 위해 얼마나 많은 힘을 사용해야 하는지"를 이해하는 것을 의미합니다.
이를 위해서는 실내외 환경의 모든 구석구석을 아우르는 방대한 양의 실시간 3D 환경 데이터가 필요합니다.
2) 가상 훈련장: 시뮬레이션된 환경에서 인공지능이 시행착오를 통해 훈련할 수 있도록 합니다.
젠슨 황이 언급한 옴니버스는 사실상 일종의 "가상 훈련장"입니다. 로봇은 실제 물리적 세계에 진입하기 전에 가상 환경에서 "만 번 넘어지면서" 걷는 법을 배우는 훈련을 받아야 합니다. 이러한 과정을 시뮬레이션에서 현실로의 전환(Sim-to-Real)이라고 합니다. 만약 로봇이 현실에서 직접 시도하고 실패를 거듭한다면, 하드웨어 비용이 천문학적으로 증가할 것입니다.
이 과정은 물리 엔진 시뮬레이션 및 렌더링 컴퓨팅 성능의 처리량에 기하급수적인 요구를 발생시킵니다.
3) 전자 피부: "촉각 데이터"는 활용 가능한 방대한 데이터의 보고입니다.
물리적 인공지능이 '촉각'을 구현하려면 온도, 압력, 질감을 감지할 수 있는 전자 피부가 필요합니다. 이러한 '촉각 데이터'는 이전에는 대규모로 수집된 적이 없는 완전히 새로운 자산입니다. 이를 위해서는 대규모 센서 데이터 수집이 필수적입니다. CES에서 Ensuring은 1,956개의 센서가 촘촘하게 집적된 '양산형 피부'를 선보였는데, 이 덕분에 로봇이 달걀 껍질을 벗기는 놀라운 효과를 구현할 수 있었습니다.
이 "촉각 데이터"는 이전에는 대규모로 수집된 적이 없는 완전히 새로운 자산입니다.
이 글을 읽고 나면 물리적 인공지능 이론의 등장이 웨어러블 기기와 휴머노이드 로봇의 출현에 얼마나 많은 기회를 제공했는지 분명히 느낄 수 있을 것입니다. 불과 몇 년 전만 해도 이러한 기기들은 "크기만 한 장난감"으로 비판받았다는 사실을 알아두시면 좋습니다.
사실 제가 말씀드리고 싶은 것은 물리적 AI라는 새로운 환경에서 암호화폐 분야 역시 생태계의 공백을 메울 수 있는 훌륭한 기회를 가지고 있다는 것입니다. 몇 가지 예를 들어보겠습니다.
1. AI 대기업들은 스트리트 뷰 차량을 보내 전 세계 주요 도로를 스캔할 수 있지만, 거리 구석구석, 동네, 지하실 같은 곳에서 데이터를 수집할 수는 없습니다. 하지만 DePIN 네트워크 기기에서 제공하는 토큰 인센티브를 활용하여 전 세계 사용자들이 개인 기기를 통해 이러한 데이터 공백을 메우도록 유도한다면, 데이터 수집의 한계를 극복할 수 있을 것입니다.
2. 앞서 언급했듯이 로봇은 클라우드 컴퓨팅 성능에 의존할 수 없지만, 특히 대량의 시뮬레이션 데이터를 처리해야 하는 경우 단기적으로 엣지 컴퓨팅 및 분산 렌더링 기능을 대규모로 활용해야 합니다. 분산 컴퓨팅 네트워크를 사용하여 유휴 상태인 일반 소비자용 하드웨어를 모아 분산 및 스케줄링함으로써 효율적으로 활용할 수 있습니다.
3. "촉각 데이터"는 대규모 센서 응용 분야를 제외하고는 이름에서 알 수 있듯이 매우 사적인 정보입니다. 어떻게 하면 대중이 이러한 개인 정보 관련 데이터를 AI 거대 기업과 공유하도록 할 수 있을까요? 실현 가능한 방법은 데이터를 제공하는 사람들에게 데이터 소유권과 그에 따른 수익을 부여하는 것입니다.
요약하자면:
황(Huang)은 물리적 AI를 웹2 AI 트랙의 후반부라고 부릅니다. 그렇다면 DePIN, DeAI, DeData와 같은 웹3 AI + 암호화 트랙에도 동일하게 적용되지 않을까요? 어떻게 생각하시나요?
