PANews는 3월 30일 알리바바의 첸원(Qianwen)이 풀모달 대규모 모델인 Qwen3.5-Omni를 출시했다고 보도했습니다. Qwen3.5-Omni 시리즈는 Plus, Flash, Light 크기의 Instruct 버전으로 구성되어 있으며, 256KB 길이의 컨텍스트를 지원하고 10시간 이상의 오디오 입력과 400초 이상의 720P(1FPS) 오디오/비디오 입력을 처리할 수 있습니다. 이 모델은 방대한 양의 텍스트, 시각 데이터, 그리고 1억 시간 이상의 오디오/비디오 데이터를 기반으로 사전 학습되어 탁월한 풀모달 인식 및 생성 능력을 보여줍니다. Qwen3-Omni와 비교하여 Qwen3.5-Omni는 다국어 기능을 크게 향상시켜 113개 언어 및 방언의 음성 인식과 36개 언어 및 방언의 음성 생성을 지원합니다.
알리바바의 Qwen 3.5-Omni 풀모달 대형 모델이 온라인에 공개되었습니다.
공유하기:
작성자: PA一线
이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.
PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
PANews 앱
24시간 블록체인 업계 소식을 추적하고 심층 기사를 분석합니다.

