PANewsは4月23日、DeepSeekが高性能GPU演算子ライブラリであるTileKernelsをGitHubページでオープンソース化したと報じた。このプロジェクトはTileLangをベースとしており、大規模言語モデル(LLM)の学習と推論に最適化されている。その演算子性能は、ハードウェアの計算負荷とメモリ帯域幅の限界に迫っている。
TileKernelsは、MoEルーティング、FP8/FP4量子化、および各種融合演算子を網羅しており、DeepSeekの内部環境ですでに使用されています。このライブラリは現在、NVIDIA SM90および最新のSM100(Blackwell)アーキテクチャに対応しており、CUDA 13.1以降が必要です。

