보스턴 다이내믹스의 휴머노이드 로봇 아틀라스가 단순한 공중제비 동작을 넘어 "작업"에 착수했습니다.

저자: 알베르토 로드리게스(아틀라스 로봇 행동 담당 이사), 셰인 로젠-레비(연구 엔지니어), 비나이 카미디

작성: 펠릭스, PANews

이 휴머노이드 로봇은 지금까지 본 어떤 로봇과도 다릅니다. 최신 영상에서 분명히 드러나는 몇 가지 특징은 다음과 같습니다. 아틀라스 로봇은 몸통을 180도 회전시키고, 웅크리고, 미니 냉장고를 들어 올려 휴식을 취하는 엔지니어에게 전달합니다. 하지만 눈에 잘 띄지 않는 부분도 있습니다. 예를 들어, 로봇이 팔, 다리, 몸통을 최대한 활용하여 사람이 하기 어려운 들어올리기 작업을 수행하는 모습이나, 영상으로는 도저히 보여줄 수 없는 로봇의 발전 속도와 동작의 정밀도 등이 있습니다.

이건 분명 상쾌한 일이지만, 왜 해야 할까요?

 아틀라스 미니 냉장고

보스턴 다이내믹스의 다른 로봇들은 가장 힘든 작업들을 자동화하도록 설계되었습니다. 스트레치 로봇은 극도로 더운 환경에서도 최대 23kg에 달하는 상자를 트럭에서 자율적으로 하역할 수 있습니다. 스팟 로봇은 매일 정확히 같은 시간에 동일한 검사 경로를 따라 동일한 측정 작업을 수행하여 공장 현장에서 문제 발생 징후를 조기에 감지합니다. 이러한 작업들은 단조롭지만 높은 수준의 세심함이 요구되며, 스트레치와 스팟은 이러한 수준의 서비스를 매일 제공합니다.

아틀라스는 공장, 창고, 건설 현장과 같이 극한의 강도, 내구성 및 정밀도가 요구되는 다양한 환경에 필요한 기능을 제공하는 것을 목표로 합니다. 보스턴 다이내믹스는 아틀라스를 수작업을 위한 다목적 도구로 개발하기 위해 노력하고 있습니다. 실제 환경에 필요한 성능과 신뢰성을 확보하기 위해서는 하드웨어와 동작 제어 모두에서 상당한 발전이 필수적입니다.

다음은 하드웨어와 동작 모두에서 상당한 발전을 보여주는 정교하게 설계된 일련의 실험 결과입니다. 아틀라스는 1월에 공개된 지 불과 몇 주 만에 힘, 민첩성, 전신 제어 능력에서 뛰어난 성능을 입증했습니다.

실생활에 필요한 신체적 지능

지난 몇 년간 시장은 실증 데이터에 힘입어 행동 아키텍처에 근본적인 변화를 겪었으며, 이러한 아키텍처는 점차 향상된 일반화 능력을 보여주고 있습니다. 적응성, 빠른 학습, 그리고 손쉬운 작업 재할당은 휴머노이드 로봇의 잠재력을 실현하는 데 핵심적인 요소입니다. 이러한 아키텍처는 데스크톱 로봇 팔뿐만 아니라 실제 작업을 수행하는 완전한 기능을 갖춘 휴머노이드 로봇의 동작에도 적용될 수 있습니다.

가장 발전된 주류 방법들은 뛰어난 성능을 보여줄 수 있지만, 몇 가지 한계점도 있습니다. 이러한 방법들은 주변 환경을 이해하는 것뿐만 아니라 제어 루프를 안내하는 데에도 지속적인 카메라 피드백에 지나치게 의존합니다 . 또한 환경과의 상호 작용이 로봇 표면의 수, 보통 손가락, 심지어 손가락 끝으로만 제한되며, 거의 전적으로 가벼운 작업에만 초점을 맞추고 있습니다.

실제 작업, 특히 고강도의 육체노동에는 "신체 지능"에 대한 더 넓은 정의가 필요합니다. 물체를 옮길 때, 팀원들은 무게를 지탱하기 위해 신체의 모든 부분을 사용하고, 촉각을 이용하여 물체의 모양, 질량, 강성에 적응합니다.

냉장고를 그냥 보고 손으로만 들어 올릴 수는 없습니다. 미리 준비하고, 무게를 예상하고, 몸을 앞으로 기울여 냉장고의 모양과 무게에 맞춰 자세를 조정하고, 들어 올릴 수 있는지 판단해야 합니다. 진정한 작업은 상호작용 과정에서 이루어집니다. 휴머노이드 로봇은 팔뚝과 이두근으로 상자를 잡고, 무릎을 이용해 무거운 물체를 땅에서 허벅지까지 들어 올리고, 길고 무거운 물체를 어깨에 메는 등, 냉장고를 들어 올리는 것만큼이나 쉽게 작업을 수행할 수 있어야 합니다.

아틀라스는 강화 학습(RL)을 사용하여 냉장고를 들어 올리는 방법을 학습합니다. 시뮬레이션 환경에서 엄청난 수의 냉장고 들어올리기 연습을 하는 것이죠. 가장 어려운 부분은 냉장고를 보거나 들어올리는 방법을 아는 것이 아니라, 아틀라스가 현실 세계에서 마주칠 수 있는 어떤 모양의 냉장고에도 적응하는 법을 배우는 것입니다. 이는 제어와 지각이 결합된 문제인데, 지각은 신체의 고유수용감각을 통해 암묵적으로 이루어집니다. 이러한 행동을 유도하는 전략들은 냉장고의 위치, 질량, 지면과의 마찰력 및 접지력, 또는 몸통, 팔, 손 사이에서의 위치 등 다양한 변화에 적응하도록 학습되었습니다. 이러한 수준의 적응력은 신체 지능의 가장 기본적인 구성 요소 중 하나입니다.

무거운 짐을 운반하는 로봇

오늘 공개된 하드웨어 또한 특별합니다. 이번 세대의 아틀라스 로봇은 실제 작업에 필요한 유연성과 강도를 충족할 뿐만 아니라 대량 생산에 필요한 단순성과 신뢰성까지 갖추도록 설계되었습니다. 휴머노이드 로봇의 외형은 장점이 있지만, 전략적인 혁신을 통해 성능과 효율성을 크게 향상시킬 수 있습니다.

당장 눈에 띄지 않을 수도 있는 몇 가지 주요 사항은 다음과 같습니다.

최소형 액추에이터: 로봇 본체에는 단 두 종류의 액추에이터만 사용됩니다. 이를 통해 더욱 효율적이고 강력한 액추에이터를 대량 생산하는 데 집중할 수 있으며, 궁극적으로 비용을 절감할 수 있습니다. 이 액추에이터들은 모두 회전형 액추에이터로, 시뮬레이션에서 정확하게 표현하기 쉽습니다. 이는 앞서 언급한 고유 감각 피드백을 활용한 고성능 강화 학습에 매우 중요합니다.
반복성이 매우 높은 구성 요소: 동일한 하위 구성 요소들이 신체에서 가능한 한 많이 재사용됩니다. 두 다리와 두 팔은 완전히 동일합니다. 어깨와 어깨 사이, 골반과 골반 사이의 구조 또한 정확히 같습니다.
무한 회전 관절: 이 액추에이터는 무한 회전이 가능합니다. 이는 관절 사이의 모든 케이블을 제거함으로써 구현되며, 액추에이터 하드웨어 고장의 주요 원인을 제거합니다. 결과적으로 아틀라스 고객의 비용을 절감하고 아틀라스만의 독보적으로 효율적인 작동 방식을 제공합니다.
대칭적인 발: 아틀라스는 앞뒤 움직임이 모두 뛰어나기 때문에 발이 대칭적입니다.
손쉬운 유지보수: 팔, 다리, 손, 머리는 모두 현장에서 교체 가능한 부품으로, 단 몇 분 만에 교체할 수 있습니다.

이동식 미니 냉장고는 근력, 전신 협응력, 그리고 고유수용감각 피드백 활용 능력을 보여줍니다. 이는 산업 현장, 특히 두 사람이 함께 작업해야 하는 제조 환경에서 무거운 물체를 옮기는 작업에 있어 하나의 기준점이 되었습니다.

하지만 실용적이지 않은 작업이라도 의미 있는 경우가 있습니다. 예를 들어, 90kg의 로봇 아틀라스는 뛰어난 열 관리 시스템 덕분에 물구나무서기와 백플립을 할 수 있는데, 이는 더운 환경에서도 작동할 수 있음을 의미합니다. 더욱이 이러한 동작들은 민첩하고 균형 있게 움직이는 법, 좁은 공간에서 자유롭게 움직이는 법, 미끄러지거나 넘어졌을 때 회복하는 법 등 다른 유용한 기술들을 훈련하는 데 도움이 됩니다.

훈련 과정

제품 및 연구 플랫폼으로서 Atlas의 목표 중 하나는 하루 안에 새로운 동작을 학습시키고 배포하는 것입니다. 이번 시연에서는 그 속도에는 미치지 못했지만, Atlas가 냉장고를 안정적으로 이동시키는 능력은 기대를 훨씬 뛰어넘었습니다.

다음은 로봇 훈련 방법입니다.

참조 궤적: 새로운 동작을 학습시키기 위해 참조 궤적이 사용됩니다. 참조 궤적은 정책에 무엇을 해야 하는지 알려주는 데이터입니다. 이는 원격 작동 시연, 애니메이션 궤적 또는 보다 추상적인 목표에 대한 설명일 수 있습니다. 냉장고 이동 작업의 경우, 아틀라스의 인간을 뛰어넘는 동작 범위를 최대한 활용하기 위해 먼저 간단한 애니메이션이 사용되었습니다.
인센티브: 다음으로, 로봇이 애니메이션 궤적을 최대한 따라가며 작업을 완료하도록 목표를 설정합니다. 바람직한 행동(아틀라스의 그리퍼에 무게를 유지하고 동일한 위치와 방향을 유지하는 것)을 강화하기 위해 보상 메커니즘을 구축하는 동시에, 로봇과 냉장고에 밀고 당기는 동작을 가하여 방해를 받더라도 주요 작업에 집중할 수 있도록 합니다.
시뮬레이션: 아틀라스는 그래픽 처리 장치(GPU)에서 시뮬레이션 프로그램을 병렬로 실행하여 수백만 시간의 동작 연습을 수행했습니다. 광범위한 시뮬레이션 경험을 통해 아틀라스는 냉장고 내부의 다양한 변화에 따라 동작을 조정하는 방법을 학습했습니다.
실제 로봇 : 시뮬레이션 결과가 만족스러웠던 후 하드웨어 테스트를 진행했습니다. 시뮬레이션은 일정 부분만 도움을 줄 수 있을 뿐이며, 하드웨어 테스트는 지속적인 개선을 위한 근본적인 방법입니다.
반복 : 실제 로봇에서 전략의 성능에 대한 실제 데이터가 확보되면, 훈련 과정을 다시 시작하여 조정하고 동작을 강화할 수 있습니다.

시뮬레이션과 현실 사이의 격차를 줄입니다

Atlas 엔터프라이즈 버전의 가장 중요한 개선 사항 중 하나는 시뮬레이션 환경의 높은 정확도 입니다. Atlas의 시뮬레이션은 실제와 매우 유사하며, 학습, 테스트 및 반복 작업을 신속하게 수행할 수 있습니다. 일반적으로 시뮬레이션에서 좋은 결과를 보이는 동작은 실제 로봇에서도 좋은 성능을 보입니다.

시뮬레이션과 현실 간의 격차는 시뮬레이션 환경에서의 전략 성능과 실제 하드웨어에서의 성능 차이를 의미합니다. 시뮬레이션에 사용되는 가정과 수학적 단순화는 현실 세계의 복잡성을 완벽하게 반영하지 못합니다. 마찰, 지연 시간, 센서 노이즈와 같은 미묘한 변화와 변수들이 누적되어 물리적 세계에서 오작동을 일으킵니다.

이 격차를 완전히 해소하는 것은 불가능할 수도 있지만, 우리는 거의 근접했습니다. 아틀라스 팀은 테스트 및 개발을 위한 엄격한 파이프라인과 시스템 지원 체계를 구축했습니다. 오늘 학습된 정책은 내일 로봇에서 완성도 높은 정책으로 테스트할 수 있으며, 수집된 데이터는 다음 버전 개발과 새로운 동작 개발에 활용될 수 있습니다.

시뮬레이션과 현실의 차이가 그토록 미미한 이유는 무엇일까요?

고정밀 하드웨어: 기존 플랫폼과 달리, 이 플랫폼은 완벽하게 대칭적인 강력하고 효율적인 액추에이터 두 개만을 사용합니다. 이러한 단순한 설계 및 구조와 액추에이터의 효율성 덕분에 시뮬레이션에서 로봇을 매우 높은 정확도로 모델링할 수 있습니다. 로봇 모델이 실제 하드웨어와 매우 유사하기 때문에 학습된 전략을 적용할 때 정확도 문제가 발생할 가능성이 적습니다. 시뮬레이션 결과는 실제 결과와 완벽하게 일치합니다.

영역 무작위화: 전략의 견고성을 높이기 위해 로봇은 이상적인 환경에서 훈련되지 않았습니다. 영역 무작위화를 통해 냉장고 무게, 바닥 마찰력, 모터 출력과 같은 매개변수를 훈련 과정 전반에 걸쳐 미세 조정했습니다. 훈련 중 발생하는 이러한 작은 무작위 변화는 최종 동작이 실제 환경 변수에 더욱 잘 적응하도록 합니다. 예를 들어, 냉장고 이동 전략은 처음에는 50~70파운드(약 23~32kg)의 하중에 맞춰 훈련되었지만, 로봇은 100파운드(약 45kg)가 넘는 물건으로 가득 찬 냉장고를 성공적으로 이동시켰습니다. 또한, 연구팀은 완벽한 조건에서만 테스트를 진행하지 않았습니다. 실험실에서 가져온 다양한 물건들을 냉장고에 넣었는데, 무게는 일정하지 않았고, 분포도 고르지 않았으며, 이동 중에 냉장고 안에서 물건들이 움직이기도 했습니다. 잘 개발된 전략을 통해 이러한 모든 방해 요소를 엔지니어가 직접 처리하는 대신 Atlas가 자동으로 제거할 수 있습니다.

인력 및 프로세스: 마지막으로, 프로세스와 운영은 교육, 테스트 및 실험을 간소화하도록 설계되었습니다. 팀은 엄격한 프로세스를 구축했으며, 많은 인력이 보이지 않는 곳에서 이를 지원하고 있습니다. 이 팀은 하드웨어 설계팀, 유지보수 기술자, 로봇 관리자 등 로봇의 실제 운영을 담당하는 여러 팀과 긴밀하게 협력합니다. 전체 조직은 Atlas를 최대한 안정적이고 효율적으로 만들면서 새로운 기능의 한계를 끊임없이 확장하기 위해 함께 노력합니다.