알리바바 클라우드, 페이페이 리 팀의 S1 모델이 Qwen 훈련 기반임을 확인 | PANews

알리바바 클라우드, 페이페이 리 팀의 S1 모델이 Qwen 훈련 기반임을 확인

PANews는 2월 6일 Sina Technology에 따르면, Fei-Fei Li와 스탠포드 대학과 워싱턴 대학의 다른 연구자들이 클라우드 컴퓨팅 수수료 50달러 미만으로 s1이라는 인공지능 추론 모델을 훈련했다고 보도했습니다. 이 모델의 수학 및 코딩 능력 테스트에서의 성과는 OpenAl의 o1과 Depsek의 R1과 같은 최첨단 추론 모델과 유사했으며, 이는 널리 주목을 받았습니다. 그러나 s1 모델은 곧 "처음부터 학습된 것이 아니며" 기본 모델은 "Ali Tongyi Qianwen(Qwen) 모델"이라는 점이 지적되었습니다. 이와 관련하여 기자는 알리바바 클라우드에 확인을 요청했습니다. 알리바바 클라우드는 이 소식을 확인하고 다음과 같이 답했습니다. "그들은 Alitong YiQianwen Qwen2.5-32B-Instruct 오픈소스 모델을 기반으로 26분 동안 16개의 H100 GPU에서 감독 미세 조정을 수행하여 새로운 모델 s1-32B를 학습시켰는데, 이는 OpenAI의 o1 및 DeepSeek의 R1과 같은 최첨단 추론 모델의 수학적 및 코딩 기능과 동일한 결과를 달성했으며, 경쟁 수학 문제에서 o1-preview보다 27% 더 높은 성과를 보였습니다."

공유하기:

작성자: PA一线

이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요

PANews WeChat 그룹

Telegram 커뮤니티 그룹

Telegram 정보 채널

추천 읽기

Biteye

2025. 06. 09. 오전 04:15

Biteye와 PANews가 공동으로 AI Layer1 연구 보고서를 발표했습니다. 체인에서 DeAI를 위한 비옥한 토양 찾기

PA荐读

2026. 04. 15. 오전 03:00

스탠포드 대학의 423페이지 분량의 AI 보고서에 따르면, 중국과 미국의 AI 기술 격차는 불과 2.7%에 불과하며, 칭화 대학의 딥시크(DeepSeek)는 세계 10위권에 진입했습니다.

Tim

2025. 12. 22. 오전 09:24

2025년 인공지능 패러다임의 6대 변화: RLVR 훈련과 바이브 코딩부터 나노 바나나까지

深潮TechFlow

2025. 10. 20. 오전 10:18

6대 AI가 거래 전쟁을 벌인다. 대형 모델이 암호화폐 거래를 활용하기 시작하면 승률은 어떻게 될까?

ShenZhen

2025. 06. 16. 오전 09:53

a16z가 3,300만 달러 규모의 시드 라운드를 주도했는데, Yupp은 블록체인과 인센티브를 기반으로 AI 평가 모델을 어떻게 재구성할까요?

PA一线

2025. 05. 28. 오후 11:00

DeepSeek, OpenAI의 최고 o3 모델과 비슷한 새로운 버전 R1 오픈 소스 공개

인기 검색:비트코인 이더리움 스테이블코인 예측 시장 지우다 RWA USDT DeFi AI 연방준비제도 이사회 의장

인기 기사

2026 홍콩 웹3 카니발에서 비탈릭 부테린의 전체 연설

탈중앙화 금융(DeFi) 담보의 변혁적인 시대에, DeFi를 위한 새로운 구성 가능한 인프라로서 위험가중자산(RWA)을 탐구합니다.

当钱包开始嵌入AI Agent：ERC-8211的新交互范式，为什么值得关注？

주간 미리보기 | 워시 연방준비제도 의장 후보자 청문회 4월 21일 예정; 2026 홍콩 웹3 카니발 개막.

Kalshi가 스포츠 예측 시장을 어떻게 재편했는지: 연간 거래량 80배 증가

업계 뉴스

시장 핫스팟

엄선된 읽을거리

PANews 앱

24시간 블록체인 업계 소식을 추적하고 심층 기사를 분석합니다.

PANews 앱 다운로드

App Store Google Play

새로운 지갑이 브렌트유에 대한 공매도 포지션을 개설하기 위해 하이퍼리퀴드에 1천만 USDC를 입금했습니다.

PANews 속보5분 전