PANews는 4월 16일 DeepSeek의 오픈 소스 행렬 연산 라이브러리인 DeepGEMM이 "Public release 26/04 " 라는 제목의 병합 요청을 시작했으며 , Mega MoE 및 FP4 Indexer와 같은 새로운 기능을 도입했다고 보도했습니다 . 이 업데이트는 MoE 에서 dispatch , linear1/SwiGLU/linear2 및 combine을 단일 메가 커널로 통합 하고 NVLink 통신과 텐서 코어 연산 간의 중복을 최적화합니다 . 현재는 FP8 x FP4 MoE , EP≤8만 지원하며 PyTorch≥2.9가 필요합니다 . 또한 FP4 Indexer (MQA 로 짓용 , 더 큰 MTP 지원 ), FP8 x FP4 GEMM , PDL 및 DeepEPv2 MoE GEMM 레이아웃을 추가하고 , GEMM 휴리스틱 및 커널을 최적화하고, JIT 컴파일 속도를 향상시키며 , 분산 파일 시스템에서 발생하는 JIT 충돌 및 부분 커널 멈춤과 같은 문제를 수정합니다 . 이번 릴리스는 DeepGEMM 개발과만 관련이 있으며 내부 모델 릴리스와는 무관합니다.
DeepSeek DeepGEMM이 Mega MoE 및 FP4 인덱서를 포함한 주요 업데이트를 출시했습니다.
공유하기:
작성자: PA一线
이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.
PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
추천 읽기
PANews 앱
24시간 블록체인 업계 소식을 추적하고 심층 기사를 분석합니다.

