DeepSeek が長期コンテキストのトレーニングと推論の効率を向上させる NSA メカニズムを導入 | PANews

DeepSeek が長期コンテキストのトレーニングと推論の効率を向上させる NSA メカニズムを導入

PANewsは2月18日、DeepSeekがハードウェアとの整合性が高くネイティブトレーニングをサポートし、超高速のロングコンテキストトレーニングと推論の実現を目指すNSA（Sparse Attention Mechanism）の発売を発表したと報じた。 NSA は、最新のハードウェア向けに最適化された設計により、モデルのパフォーマンスに影響を与えることなく推論速度を加速しながら、事前トレーニングコストを大幅に削減します。

公式紹介によると、NSA は一般的なベンチマーク、長いコンテキストのタスク、および命令ベースの推論で優れたパフォーマンスを発揮し、フルアテンションモデルと同等かそれ以上のパフォーマンスを発揮します。

原文リンク

共有先：

著者：PA一线

この内容は市場情報の提供のみを目的としており、投資助言を構成しません。

PANews公式アカウントをフォローして、強気・弱気相場を一緒に乗り越えましょう

PANews WeChatグループ

Telegram交流グループ

Telegram情報チャンネル

おすすめ記事

PA一线

10 時間前

Nvidia は、オープンウェイト AI モデルの開発に今後 5 年間で 260 億ドルを投資する予定です。

蓝鲸新闻

2026/03/06 08:48

OpenClaw は人気が高まっており、最初に収益を上げているのは、1 セッションあたり 500 元のオンサイトインストールサービスです。

PA一线

2026/01/27 05:55

DeepSeek は、AI が人間と同じ論理順序で画像を「見る」ことを可能にする DeepSeek-OCR 2 をリリースしました。

PA一线

2026/01/21 00:58

DeepSeek の新モデル MODEL1 コードが漏洩し、完全に新しいアーキテクチャが示唆されています。

PA一线

2026/01/09 13:18

海外メディアの報道：DeepSeekは2月に次世代の主力AIモデルをリリースする予定。

PA一线

2026/01/01 09:37

DeepSeek は、Liang Wenfeng が執筆した新しい論文を公開しました。大規模モデルのトレーニング安定性を向上させる新しい mHC アーキテクチャを提案しています。

人気検索:ビットコインイーサリアムステーブルコイン予測市場トランプバイナンス OKX USDT DeFi AI 連邦準備制度理事会議長

人気記事

OpenClaw創設者：Tencent SkillHubがClawHubのデータをスクレイピングしたため、サーバーコストが上昇した。

香港証券先物委員会：RWAトークン化商品は現在、株式取引には適しておらず、従来の取引に比べて利点はない

経済学者たちは、株式市場のバブルは50年前の石油危機の再来よりも脆弱だと警告している。

情報筋によると、香港はHSBC、スタンダード・チャータード、OSLにステーブルコインのライセンスを発行する予定だ。

Bitwise: ビットコインが 100 万ドルに達する運命にあるのはなぜですか?

業界ニュース

市場ホットスポット

厳選読み物

購読をクリック

PANewsアプリ

24時間ブロックチェーン業界情報を追跡し、深掘り記事を解析。

PANewsアプリをダウンロード

App Store Google Play