DeepSeek新模型MODEL1程式碼曝光,疑為全新架構

PANews 1月21日訊息,根據量子位元報導,DeepSeek在GitHub更新的FlashMLA程式碼中首次出現「MODEL1」名稱,覆蓋114個文件中28處提及,且與現有版本V32(DeepSeek-V3.2)並列,暗示MODEL1為下一代新架構模型。程式碼差異顯示該模型在KV快取佈局、稀疏性處理及FP8解碼等方面進行了優化,或將在春節前後正式發布。結合近期公開的mHC殘差連結機制與Engram記憶模組,MODEL1可望整合多項自研創新。

分享至:

作者:PA一线

本內容只為提供市場資訊,不構成投資建議。

關注PANews官方賬號,一起穿越牛熊
推薦閱讀
5小時前
2026-01-15 13:13
2026-01-09 13:18
2026-01-01 09:37
2025-12-23 13:00
2025-12-22 09:24

熱門文章

行業要聞
市場熱點
精選讀物

精選專題

App内阅读