DeepSeek が DeepGEMM をリリース: V3/R1 のトレーニングと推論を最適化する効率的な FP8 GEMM ライブラリ

PANews は 2 月 26 日、DeepSeek が OpenSourceWeek の 3 日目に DeepGEMM をリリースしたと報じました。DeepGEMM は FP8 GEMM をサポートし、密行列計算や専門家混合 (MoE) アーキテクチャに使用して V3/R1 モデルのトレーニングと推論を最適化できる CUDA ライブラリです。

DeepGEMMの主な機能:

• 超高性能: Hopper GPU で 1350+ FP8 TFLOPS

• 最小限の依存関係: 重い依存関係はなく、チュートリアルのようなシンプルなコード

• JIT コンパイル: 事前コンパイルは不要、実行時に自動的に最適化

• コアコードはわずか300行程度ですが、ほとんどの行列サイズで専門家が最適化したカーネルよりも優れたパフォーマンスを発揮します。

• 密集レイアウトと2つのMoEレイアウトをサポート

共有先:

著者:PA一线

この内容は市場情報の提供のみを目的としており、投資助言を構成しません。

PANews公式アカウントをフォローして、一緒に強気相場と弱気相場を乗り越えましょう
おすすめ記事
2026-01-01 09:37
2025-12-23 13:00
2025-12-22 09:24
2025-12-04 07:40
2025-12-02 00:14
2025-11-27 13:45

人気記事

業界ニュース
市場ホットスポット
厳選読み物

厳選特集

App内阅读