PANewsは1月21日、QuantumBitの情報によると、GitHub上のDeepSeekの最新FlashMLAコードに「MODEL1」という名称が初めて登場したと報じました。このコードは114のファイルに28回言及され、既存バージョンV32(DeepSeek-V3.2)と並んでリストされています。これは、MODEL1が次世代アーキテクチャモデルであることを示唆しています。コードの違いから、このモデルはKVキャッシュレイアウト、スパース処理、FP8デコードなどの領域で最適化されており、春節(旧正月)頃に正式リリースされる可能性があります。最近公開されたmHC残差接続機構とEngramメモリモジュールと組み合わせることで、MODEL1は複数の自社開発イノベーションを統合することが期待されます。
DeepSeek の新モデル MODEL1 コードが漏洩し、完全に新しいアーキテクチャが示唆されています。
共有先:
著者:PA一线
この内容は市場情報の提供のみを目的としており、投資助言を構成しません。
PANews公式アカウントをフォローして、一緒に強気相場と弱気相場を乗り越えましょう
おすすめ記事
