알리바바, 더욱 효율적인 인공지능 모델 'Qwen3-Next' 출시 | PANews

알리바바, 더욱 효율적인 인공지능 모델 'Qwen3-Next' 출시

PANews는 9월 12일 Alibaba의 Tongyi Qianwen이 차세대 기본 모델 아키텍처인 Qwen3-Next를 출시하고 이 아키텍처를 기반으로 Qwen3-Next-80B-A3B 시리즈 모델을 오픈 소스화했다고 보도했습니다. Qwen3 MoE 모델 아키텍처와 비교하여 이 아키텍처는 다음과 같은 핵심 개선 사항을 특징으로 합니다. 하이브리드 어텐션 메커니즘, 고도로 희소한 MoE 구조, 안정적이고 사용자 친화적인 학습을 위한 일련의 최적화, 추론 효율성을 개선하기 위한 다중 토큰 예측 메커니즘입니다. Alibaba는 Qwen3-Next 모델 아키텍처를 기반으로 800억 개의 매개변수가 있지만 30억 개만 활성화하는 Qwen3-Next-80B-A3B-Base 모델을 학습했습니다. 이 Base 모델은 Qwen3-32B 밀집 모델과 비슷하거나 약간 더 나은 성능을 달성하는 반면 학습 비용(GPU 시간)은 Qwen3-32B의 1/10 미만입니다. 32k 이상의 컨텍스트에 대한 추론 처리량은 Qwen3-32B보다 10배 이상 높아서 학습과 추론 모두에서 뛰어난 비용 효율성을 달성합니다.

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요

PANews WeChat 그룹

Telegram 커뮤니티 그룹

Telegram 정보 채널

추천 읽기

PA一线

36분 전

이란, 미국 내 시티은행 지점 공격

PA一线

45분 전

Scallop은 Asymptotic이 수행한 모든 형식적 검증을 완료했습니다.

PA一线

1시간 전

비탈릭: 이더리움 비콘과 실행 클라이언트 분리 체계를 재검토해야 합니다.

PA一线

2시간 전

BITGIN 자금 세탁 사건의 배후 인물이 대만에서 기소되었으며, 관련된 금액은 1억 5천만 대만 달러를 초과합니다.

PA一线

2시간 전

비트코인 초창기 지지자인 에릭 보어히스가 다시 한번 금 토큰을 매입하며 총 2,376만 달러를 들여 XAUT와 PAXG를 구매했습니다.

PA一线

2시간 전

이란 관리: 우크라이나는 이란의 공격 대상이 될 수 있는 합법적인 목표물이 되었다

인기 검색:비트코인 이더리움 스테이블코인 예측 시장 지우다 바이낸스 OKX USDT DeFi AI 연방준비제도 이사회 의장

인기 기사

트럼프: 많은 국가들이 미국과 함께 호르무즈 해협의 항행 안전을 확보하기 위해 군함을 파견할 것입니다.

어제 비트코인 현물 ETF에는 1억 8천만 달러의 순유입이 발생하여 5일 연속 순유입을 기록했습니다.

이론을 이해하는 것이 곧 이점을 얻는 것은 아니다: 매우 똑똑한 사람들이 흔히 저지르는 수학적 오류 5가지

주간 하이라이트 | "랍스터" 열풍에 작별을 고하고 암호화폐의 본질로 돌아가세요: 이번 주 가장 핫한 프로젝트는 Hyperliquid입니다

이더리움 현물 ETF는 어제 2,669만 2,600달러의 순유입을 기록하며 4일 연속 순유입을 이어갔습니다.

업계 뉴스

시장 핫스팟

엄선된 읽을거리

PANews 앱

24시간 블록체인 업계 소식을 추적하고 심층 기사를 분석합니다.

PANews 앱 다운로드

App Store Google Play