作者:Mike Kalil
편집: Felix, PANews
중국에서 AI 기반 휴머노이드 로봇들이 태블릿 PC 조립 라인에서 자율적으로 작업하는 모습이 생중계되었으며, 이는 업계 최초로 평가받고 있습니다.
역사적인 며칠간의 생중계에서 이 휴머노이드 로봇들은 인간 동료들과 함께 품질 검사 작업을 수행했습니다. 설립된 지 3년밖에 되지 않은 스타트업이 개발한 이 로봇들의 부상은 전 세계 최고의 로봇 기업들에게 큰 경쟁 압력을 가하고 있습니다.
투자자들이 미래의 일자리 모델을 재정의하는 데 수십억 달러를 쏟아붓는 가운데, 이는 미래 공장의 발전 방향을 예고하는 것일 수 있습니다. AI 물리 분야의 골드러시 속에서 로봇 기업들은 자신들의 기계가 실제 작업에 투입될 준비가 되었음을 입증하기 위해 과감한 행보를 보이고 있습니다.
기업들은 오랫동안 너무 어렵고, 정밀하며, 변수가 많아 자동화할 수 없다고 여겨졌던 작업을 로봇에게 맡기기 시작했습니다. 점점 더 복잡해지는 작업 흐름 속에서 다양한 형태의 로봇들은 협업에 점점 더 능숙해지고 있습니다. 지능이 높아지면서 이들은 점점 더 인간처럼 학습하고 있지만, 그 규모는 어떤 개인이나 노동력도 따라잡을 수 없습니다.
아지봇(AgiBot)의 6일간의 생중계 쇼
상하이에서 신생 로봇 스타트업 아지봇(AgiBot)이 실제 태블릿 PC 생산 라인에서 자율 휴머노이드 로봇들을 가동하는 모습을 담은 생중계를 시작했으며, 이는 업계 최초로 평가됩니다.
이 로봇 회사는 전 화웨이 '천재 소년' 출신 펑즈후이(Peng Zhihui)가 2023년 2월에 설립했으며, 2026년 상반기까지 1만 대 이상의 로봇을 생산할 계획이라고 밝혔습니다. 보도에 따르면 아지봇은 글로벌 사업을 적극적으로 확장하고 있으며, 선전의 중칭 로봇(EngineAI), 푸두 로보틱스(Pudu Robotics), 베이징의 갤봇(Galbot) 등 경쟁사들과 함께 홍콩 증시 상장을 계획하고 있습니다.
아지봇의 부상은 항저우에 본사를 둔 유닛리 로보틱스(Unitree Robotics)와 피규어 AI(Figure AI) 같은 서구 기업들에게 도전 과제를 안겨주고 있습니다. 유닛리 로보틱스는 2025년 한 해 휴머노이드 로봇과 사족 보행 로봇 분야에서 전 세계를 선도했던 기업입니다.
출처: 아지봇(AgiBot)
실리콘밸리의 피규어(Figure)가 며칠간의 생중계로 큰 화제를 모은 지 몇 주 뒤, 아지봇도 6일간의 생중계를 시작했습니다. 피규어의 생중계는 소수의 이족 보행 휴머노이드 로봇 Figure 03이 모의 물류 환경에서 교대로 상자를 분류하는 모습을 보여주었습니다. 이들은 통제된 환경에서 8일간 하루 24시간 쉬지 않고 작업했습니다. 한 로봇이 약 4시간 작업 후 배터리가 부족해지면 자동으로 충전소로 이동해 충전하고, 그 사이 다른 로봇이 작업을 이어받았습니다.
이와 대조적으로 아지봇의 생중계는 난창 롱치 테크놀로지(Longcheer Technology)의 태블릿 PC 제조 공장에서 인간과 협업하는 더 큰 규모의 바퀴형 양팔 이동 조작 로봇들을 선보였습니다. 이들은 오전 8시부터 오후 6시까지(점심 시간 포함) 표준 공장 근무 시간에 맞춰 주로 품질 검사를 수행했습니다.
태블릿 PC 조립 라인의 로봇은 산업용으로 설계된 아지봇의 G2 모델입니다. G2는 신장 1.7m, 무게는 최대 100kg에 달합니다. 보도에 따르면 G2는 몸 전체에 26개의 자유도를 지니고 있으며, 옵션으로 정교한 로봇 핸드를 통합할 수 있습니다.
발표회 생중계에서 아지봇 G2가 활로 분홍색 풍선을 맞추기 위해 준비하고 있는 모습 (출처: 아지봇)
이 휴머노이드 로봇은 동작, 상호작용, 조작 지능을 하나의 통합된 아키텍처로 결합한 아지봇의 자체 개발 AI 시스템을 탑재하고 있습니다. G2는 현실 세계의 강화 학습과 자사의 월드 모델인 아지봇 월드(Agibot World)의 대규모 데이터셋을 통해 지속적으로 성능을 향상시킬 수 있다고 합니다.
이 로봇은 24시간 연속 가동이 가능하도록 설계되었으며, 바퀴형 베이스에는 핫스왑이 가능한 배터리가 내장되어 있습니다. 유효 탑재량과 동작 강도에 따라 한 번 충전으로 4~8시간 작동합니다. 배터리는 로봇을 끄지 않고도 몇 분 안에 교체할 수 있습니다. 하지만 현재로서는 유비테크(UBTECH)의 Walker S2, 헥사곤(Hexagon)의 AEON, 보스턴 다이내믹스(Boston Dynamics)의 Atlas처럼 스스로 배터리를 교체할 수는 없습니다.
롱치 조립 라인에서 작업하는 로봇은 전용 로봇 팔로 태블릿 PC를 집어 센서로 검사한 후 트레이에 넣습니다. 이 공장은 샤오미, 삼성, 레노버와 같은 기술 대기업들을 위해 전자 제품을 생산합니다.
아지봇 G2 휴머노이드 로봇 그리퍼 (출처: 아지봇)
보도에 따르면 아지봇 G2의 시작 가격은 약 13만 8천 달러로, 이는 현재 공장 배치 옵션 중에서 실제로 비교적 저렴한 편에 속합니다.
하지만 이 스타트업이 가장 주목받는 제품은 사실 링시 X2(Lingxi X2) 로봇으로, 시작 가격은 약 1만 3천 달러(고급형 모델은 약 5만 달러에 근접)입니다. X2는 신장 1.3m, 무게 34kg으로 가벼운 조작 및 엔터테인먼트 용도로 설계되었습니다. 그러나 아지봇은 최근 고급형 모델이 통제된 환경에서 미니 냉장고를 옮기는 영상을 공유했습니다.
아지봇의 X2(왼쪽)와 보스턴 다이내믹스의 Atlas가 각각 다른 시연에서 미니 냉장고를 들어 올리는 모습 (출처: 아지봇/보스턴 다이내믹스)
이는 분명 보스턴 다이내믹스를 향한 ‘간접 메시지’입니다. 일주일 전, 이 매사추세츠 소재 로봇 기업이 Atlas 휴머노이드 로봇이 유사한 작업을 수행하는 모습을 선보였기 때문입니다.
두 시연의 전체적인 컨셉은 동일하지만 몇 가지 중요한 차이점이 있습니다. 보스턴 다이내믹스의 시연에서 Atlas는 정교한 로봇 손으로 미니 냉장고를 집어 올렸지만, 그 과정에서 눈에 띄는 손상을 입혔습니다. 반면 아지봇의 X2는 냉장고에 부착된 맞춤형 손잡이를 이용해 로봇 팔로 들어 올렸습니다. 또한 Atlas가 집은 냉장고는 아지봇 연구실에 있던 것보다 더 커 보였습니다.
그러나 Atlas의 무게 또한 X2의 두 배가 넘는 90kg입니다. 신장 역시 2m에 근접하여 X2보다 훨씬 큽니다. 두 로봇 모두 자체 AI를 활용해 방대한 시뮬레이션 훈련과 실시간 센서 피드백을 통해 작업을 수행하지만, Atlas의 장점은 인간을 뛰어넘는 회전 관절에 있습니다.
현재 아지봇이 2026년까지 2만 대 규모의 로봇 생산 능력 목표를 세움에 따라, 공공장소에서 아지봇의 휴머노이드 로봇을 목격할 가능성이 더 높습니다. 보스턴 다이내믹스 역시 자사의 Atlas, 또 다른 유명 로봇 Spot, 그리고 물류 솔루션 Stretch를 노동 시장에 적극적으로 투입하고 있습니다. 보도에 따르면, 모회사인 현대자동차는 3만 대 생산 능력을 확보하기 위해 보스턴 다이내믹스의 완전 인수를 추진하고 있는 것으로 알려졌습니다.
생추어리 AI(Sanctuary AI), 와이어링 하니스 기술 획기적 발전 주장
캐나다 스타트업 생추어리 AI(Sanctuary AI)는 유니버설 로봇(Universal Robots)의 양팔 협동 로봇 시스템을 훈련시켜 자동차 제조에서 자동화하기 가장 어려운 작업 중 하나를 성공적으로 수행했다고 밝혔습니다.
생추어리 AI는 범용 휴머노이드 로봇 Phoenix로 가장 잘 알려져 있지만, 현재 모든 산업용 로봇으로 사업 범위를 확장하고 있습니다. 이 회사는 다양한 폼팩터의 로봇에 적용할 수 있는 Carbon이라는 물리적 AI 모델을 개발 중입니다.
생추어리 AI는 자사의 Carbon AI 모델을 통해 이 양팔 협동 로봇 시스템이 자동차 제조 과정에서 와이어링 하니스와 커넥터 삽입 작업을 완수할 수 있도록 지원한다고 밝혔습니다. (출처: 생추어리 AI)
이 밴쿠버 소재 로봇 회사는 1차 자동차 공급업체를 위해 UR 로봇이 와이어링 하니스와 커넥터를 삽입하는 작업 영상을 공개했습니다. 인간에게는 커넥터를 반복해서 끼우는 일이 식은 죽 먹기지만, 로봇에게는 제한된 유연성 때문에 매우 어려운 작업입니다.
생추어리 AI는 이 시스템이 99.5% 이상의 성공률과 2.5초의 작업 시간을 기록했다고 밝혔습니다. 이는 이름이 밝혀지지 않은 해당 고객사의 생산 라인 요구 사항을 충족할 만큼 빠르고 안정적인 성능을 의미합니다.
링치완우(MindOn Tech)의 범용 AI 로봇 두뇌
범용 AI 로봇 두뇌 개발에 주력하는 또 다른 스타트업 '링치완우'(MindOn Tech)는 최근 휴머노이드 로봇과 협동 로봇들이 물류 작업 흐름을 수행하는 시연 영상을 공개했습니다.
선전에 본사를 둔 이 회사는 전 텐센트 연구원들이 2025년에 설립했으며, 이 로봇들이 완전히 자율적으로 작동할 수 있다고 밝혔다. 영상에서 한 대의 Unitree G1 휴머노이드 로봇이 상자에서 물건을 꺼내 컨베이어 벨트에 올려놓고, 두 대의 양팔 협동 로봇이 배송을 위해 포장 작업을 한다. 포장이 끝나면 다른 Unitree 이족 보행 로봇이 배송 대기 중인 물건을 가져간다. 포장에는 아마존 프라임의 브랜드 로고가 인쇄되어 있지만, 현재로선 양측이 공식 협력 관계에 있다는 증거는 없다.
링치완우(灵启万物)의 데모 영상에서 휴머노이드 로봇과 협동 로봇이 동일한 AI 두뇌를 이용해 협업하는 모습(출처: 링치완우)
링치완우는 자사의 Mind0 모델이 인간 중심 데이터로 학습되었다고 밝혔다. 이 데이터에는 머리 장착 카메라로 촬영한 인간 중심 영상, 핸드헬드 그리퍼 기기로 수집한 조작 데이터, 모션 캡처 수트로 포착한 전신 동작이 포함된다. 또한 시뮬레이션 동작과 실제 세계 동작 간의 격차를 줄이기 위해 소량의 물리적 로봇 테스트 데이터도 결합했다.
이 스타트업은 Mind0이 시스템의 초기 버전이라고 밝혔다. 이들은 AI 로봇 두뇌의 규모와 지능, 범용성을 더욱 향상시켜 로봇 팀이 공장, 창고, 그리고 궁극적으로는 가정에서 더 길고 복잡한 작업을 수행할 수 있도록 할 계획이다.
EgoEngine, 영상을 로봇에 더 유용하게 만들다
현재 여러 연구실에서 인터넷상의 방대한 영상 소재를 활용하는 방안을 연구 중이다. 예를 들어 조지아 공과대학교 연구진은 기존의 1인칭 시점 영상 클립을 통해 로봇의 조작 기술을 훈련할 수 있는 EgoEngine이라는 AI 시스템을 최근 선보였다.
EgoEngine GitHub 홈페이지
그 규모는 매우 방대할 수 있다. 유튜브에는 매일 2,000만 개 이상의 영상이 업로드된다. 이 중 극히 일부만이 자기 중심적(egocentric) 영상이라 하더라도 수천만 개의 영상을 로봇에게 요리부터 전자제품 조립까지 다양한 기술을 가르치는 데 사용할 수 있음을 의미한다.
EgoEngine은 먼저 각 영상 프레임에서 사람의 팔과 손을 식별하여 제거한다. 그런 다음 디지털 트윈 모델에서 장면을 재구성해 로봇이 동일한 작업을 수행하는 새 영상을 생성한다. 사람의 동작은 로봇 모션 데이터로 변환되고 로봇이 안전하게 동작을 실행할 수 있도록 최적화된다.
연구진은 두 개의 다섯 손가락 로봇 핸드를 갖춘 레인보우 로보틱스(Rainbow Robotics)의 양팔 매니퓰레이터로 이 시스템을 테스트했다. 이 시스템의 성능은 원격 조작으로 훈련된 로봇과 거의 동등한 수준이라고 연구진은 밝혔다.
UC버클리와 엔비디아가 공동 개발한 T-Rex 시스템
캘리포니아 대학교 버클리(UC버클리)와 엔비디아 연구진은 자기 중심적 기록을 활용해 로봇의 눈-손 촉각 협응 능력을 인간 수준에 가깝게 만드는 새로운 AI 시스템을 공동 개발했다.
이들은 T-Rex라는 이 시스템을 Dexmate Vega-1 로봇에 탑재하여 테스트했으며, 이 로봇에는 샤프파(Sharpa)의 Wave 그리퍼가 통합되어 있다. Wave 그리퍼는 현재 시장에서 가장 진보된 엔드 이펙터 중 하나로, 각 구동기에 22개의 자유도가 있다고 알려져 있다.
T-Rex 시스템이 샤프파 Wave 그리퍼를 훈련시키는 모습
연구진에 따르면 T-Rex는 칫솔에 치약 짜기, 전구 돌려 끼우기 등 높은 수준의 촉각 조작이 필요한 12가지 과제를 수행했다. 2만 2천 시간 이상의 1인칭 영상과 100시간 분량의 촉각 데이터셋으로 학습된 AI 두뇌를 기반으로 자율적으로 작동한다.
이 로봇은 자연어 명령을 따르며 머리 카메라로 주변을 이해하고 손목 카메라로 각 손의 움직임을 모니터링한다. 동시에 손의 촉각 센서는 끊임없이 변화하는 힘을 지속적으로 측정한다.
T-Rex는 이러한 신호의 순간적인 변화를 추적하며, 이른바 '트랜스포머 하이브리드 아키텍처'는 여러 전문 AI 에이전트로 구성된 팀처럼 협업한다. 한 에이전트는 휴머노이드 로봇의 동작을 계획하고, 다른 에이전트는 촉각을 활용해 빠르게 수정한다.
T-Rex의 평균 성공률은 65%로, 현재 가장 강력한 시스템보다 약 30% 높다. 하지만 연구팀은 완전한 자율 작동을 위해서는 더 진보된 센서와 더 정밀한 제어가 여전히 필요하다고 밝혔다.
이 연구에는 스탠퍼드 대학교, 파나소닉, 로마 대학교, ItalAI 연구진도 참여했다.


