DeepSeek-V3.2-Exp模型正式发布并开源

PANews 9月29日消息,DeepSeek-V3.2-Exp模型今日正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

分享至:

作者:PA一线

本内容只为提供市场信息,不构成投资建议。

关注PANews官方账号,一起穿越牛熊
推荐阅读
2025-12-04 07:40
2025-12-02 00:14
2025-11-27 13:45
2025-11-24 06:37
2025-11-21 09:00
2025-11-07 08:02

热门文章

行业要闻
市场热点
精选读物

精选专题

App内阅读