Gradient는 AI 연구 효율성을 10배 이상 향상시키는 Echo-2 RL 프레임워크를 출시했습니다.

  • Echo-2 프레임워크는 대규모 모델의 강화 학습 후 훈련 비용을 10배 낮추어 연구 효율을 10.6배 향상시킵니다.
  • DAPO-17k 데이터셋 벤치마크 테스트에서 훈련 시간이 124시간에서 9.5시간으로 줄어들고 비용이 4,490달러에서 425달러로 감소했습니다.
  • 주요 기술은 비동기 강화 학습, 3계층 모듈식 아키텍처, Lattica 통신 프로토콜, 불안정 인스턴스 내결함성 스케줄링을 포함합니다.
  • 소비자급 GPU 통합을 지원하여 Qwen3-0.6B와 같은 소형 모델이 텍사스 홀덤에서 더 큰 모델을 이길 수 있습니다.
  • 상업화로 Echo-2 기반 Logits RLaaS 플랫폼을 도입하여 AI 연구 반복을 가속화합니다.
요약

분산형 AI 연구소인 Gradient는 오늘 AI 연구의 학습 효율성을 저해하는 장벽을 허물기 위한 분산 강화 학습 프레임워크인 Echo-2(arxiv.org/pdf/2602.02192)를 발표했습니다. Echo-2는 아키텍처 수준에서 학습자와 행위자를 완전히 분리함으로써 300억 데이터셋 모델의 학습 후 처리 비용을 4,500달러에서 425달러로 대폭 절감합니다. 이는 동일한 예산으로 연구 처리량을 10배 이상 향상시킬 수 있음을 의미합니다.

이 프레임워크는 비동기 강화 학습(Async RL)을 위해 인메모리 연산 분리 기술을 활용하여, 대규모 샘플링 연산 작업을 Parallax 기반의 불안정한 GPU 인스턴스 및 이기종 GPU로 분산 처리합니다. 제한된 정체(bounded stagnation), 인스턴스 내결함성 스케줄링, 그리고 자체 개발한 Lattica 통신 프로토콜을 결합하여 모델 정확도를 유지하면서 학습 효율성을 크게 향상시킵니다. Gradient는 이 프레임워크 출시와 함께 RLaaS 플랫폼인 Logits도 곧 선보일 예정이며, 이를 통해 AI 연구를 "자본 축적"에서 "효율성 반복"이라는 새로운 패러다임으로 전환하고자 합니다. Logits는 현재 전 세계 학생 및 연구자를 대상으로 예약 접수를 받고 있습니다(logits.dev).

그라디언트에 대하여

그래디언트는 분산 인프라 구축에 전념하는 AI 연구소로, 최첨단 대규모 모델의 분산 학습, 서비스 및 배포에 집중하고 있습니다. 최고 수준의 투자 기관들의 지원을 받는 그래디언트는 개방적이고 효율적인 미래의 인텔리전스를 만들어가고 있습니다.

공유하기:

작성자: 项目动态

이 글은 PANews 입주 칼럼니스트의 관점으로, PANews의 입장을 대표하지 않으며 법적 책임을 지지 않습니다.

글 및 관점은 투자 조언을 구성하지 않습니다

이미지 출처: 项目动态. 권리 침해가 있을 경우 저자에게 삭제를 요청해 주세요.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요