阿里巴巴推出更高效的Qwen3-Next人工智能模型 | PANews

阿里巴巴推出更高效的Qwen3-Next人工智能模型

PANews 9月12日消息，阿里巴巴旗下通义千问发布了下一代基础模型架构Qwen3-Next，并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。该结构相比Qwen3的MoE模型结构,进行了以下核心改进：混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化，以及提升推理效率的多token预测机制。基于Qwen3-Next的模型结构，阿里训练了Qwen3-Next-80B-A3B-Base模型，该模型拥有800亿参数仅激活30亿参数。该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能，而它的训练成本(GPU hours) 仅为Qwen3-32B的十分之一不到，在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上，实现了极致的训练和推理性价比。

分享至：

作者：PA一线

本内容只为提供市场信息，不构成投资建议。

关注PANews官方账号，一起穿越牛熊

PANews微信群

Telegram交流群

Telegram资讯频道

推荐阅读

PA一线

20分钟前

现货白银跌破80美元关口

PA一线

24分钟前

亿万富翁Stanley Druckenmiller：稳定币或成未来全球支付基础设施

PA一线

31分钟前

消息人士：伊朗已同意印度政府的申请，批准两艘液化石油气运输船经霍尔木兹海峡通行

PA一线

48分钟前

Cumberland关联钱包过去2小时从CEX提取2.3万枚ETH

PA一线

53分钟前

过去24小时全网合约爆仓3.07亿美元，主爆空单

PA一线

1小时前

巴克莱：预计美联储将于2026年9月和2027年3月各降息25个基点

热搜:比特币以太坊稳定币预测市场特朗普币安 OKX USDT DeFi AI 美联储主席

热门文章

韩国股市，想说冷静不容易

远川投资评论

迪拜TOKEN2049峰会延期至2027年4月举行

a16z：致加密创始人，企业不买最好的技术

英美执法机构收缴加密资产后，物归原主率≈0

Odaily星球日报

从OpenClaw到250亿RWA市场：AI代理如何悄悄接管链上资产

行业要闻

市场热点

精选读物

PANews APP

24小时追踪区块链行业资讯，行业深度文章解析。

下载 PANews App

App Store Google Play