딥시크의 새로운 모델인 MODEL1의 코드가 유출되었는데, 이는 완전히 새로운 아키텍처를 시사합니다.

PANews는 1월 21일 QuantumBit의 발표를 인용하여, DeepSeek의 GitHub에 공개된 업데이트된 FlashMLA 코드에서 "MODEL1"이라는 이름이 처음으로 등장했다고 보도했습니다. 이 코드는 114개 파일에서 총 28번 언급되었으며, 기존 버전인 V32(DeepSeek-V3.2)와 함께 나열되어 있어 MODEL1이 차세대 아키텍처 모델임을 시사합니다. 코드의 차이점을 통해 이 모델은 KV 캐시 레이아웃, 희소성 처리, FP8 디코딩 등의 영역에서 최적화되었으며, 춘절 즈음에 공식 출시될 가능성이 있습니다. 최근 공개된 mHC 잔류 연결 메커니즘 및 엔그램 메모리 모듈과 결합된 MODEL1은 여러 자체 개발 혁신 기술을 통합할 것으로 기대됩니다.

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
PANews APP
Balancer 공격자와 연관된 주소는 지난 9시간 동안 5,609 ETH(미화 1,300만 달러 상당)를 THORChain으로 이체했습니다.
PANews 속보