PANews가 2월 10일자 보도에 따르면, 영상 생성 실험 모델 'VideoWorld'는 두바오 빅모델 팀, 베이징교통대학, 중국과학기술대학이 공동으로 제안했다. Sora, DALL-E, Midjourney 등 주류의 멀티모달 모델과 달리 VideoWorld는 언어 모델에 의존하지 않고 세계 인식을 실현한 업계 최초의 모델입니다. 현재 프로젝트 코드와 모델은 오픈 소스입니다.
두바오: 시각만으로 세상을 인식하는 영상 생성 모델 '비디오월드', 오픈소스로 공개
공유하기:
작성자: PA一线
이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.
PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
추천 읽기
