DeepSeek DeepGEMM이 Mega MoE 및 FP4 인덱서를 포함한 주요 업데이트를 출시했습니다.

PANews는 4월 16일 DeepSeek의 오픈 소스 행렬 연산 라이브러리인 DeepGEMM이 "Public release 26/04 " 라는 제목의 병합 요청을 시작했으며 , Mega MoE FP4 Indexer와 같은 새로운 기능을 도입했다고 보도했습니다 . 이 업데이트는 MoE 에서 dispatch , linear1/SwiGLU/linear2 combine을 단일 메가 커널로 통합 하고 NVLink 통신과 텐서 코어 연산 간의 중복을 최적화합니다 . 현재는 FP8 x FP4 MoE , EP≤8만 지원하며 PyTorch≥2.9가 필요합니다 . 또한 FP4 Indexer (MQA 로 짓용 , 더 큰 MTP 지원 ), FP8 x FP4 GEMM , PDL DeepEPv2 MoE GEMM 레이아웃을 추가하고 , GEMM 휴리스틱 및 커널을 최적화하고, JIT 컴파일 속도를 향상시키며 , 분산 파일 시스템에서 발생하는 JIT 충돌 및 부분 커널 멈춤과 같은 문제를 수정합니다 . 이번 릴리스는 DeepGEMM 개발과만 관련이 있으며 내부 모델 릴리스와는 무관합니다.

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
PANews APP
미국 증시는 전반적으로 상승 마감했고, 암호화폐 관련 주식은 혼조세를 보였다.
PANews 속보