PANewsは1月1日、DeepSeekがManifold Constrained Hyperconnectivity(mHC)と呼ばれる新しいアーキテクチャを提案する新しい論文を発表したと報じました。このアーキテクチャは、ハイパーコネクテッドネットワーク(HC)技術における恒等写像特性の侵害によって引き起こされるトレーニングの不安定性とスケーラビリティの制限の問題に対処することを目的としています。このアーキテクチャは、HCの残余接続空間を特定の多様体にマッピングすることで恒等写像特性を復元し、厳密なインフラストラクチャ最適化を組み合わせて効率性を確保することで、大幅なパフォーマンス向上と優れたスケーラビリティを実現します。DeepSeekは、HCの柔軟で実用的な拡張であるmHCが、トポロジーアーキテクチャ設計への理解を深め、ベースモデルの進化の有望な方向性を示すことに期待しています。この論文は、Zhenda Xie、Yixuan Wei、Huanqi Caoの3人が共同執筆し、Wenfeng Liangも著者として名を連ねています。
DeepSeek は、Liang Wenfeng が執筆した新しい論文を公開しました。大規模モデルのトレーニング安定性を向上させる新しい mHC アーキテクチャを提案しています。
共有先:
著者:PA一线
この内容は市場情報の提供のみを目的としており、投資助言を構成しません。
PANews公式アカウントをフォローして、一緒に強気相場と弱気相場を乗り越えましょう
おすすめ記事
