PANews는 2월 6일 Forbes에 따르면 TikTok의 모회사인 ByteDance가 단 하나의 사진으로부터 사람들이 말하고, 몸짓을 하고, 악기를 연주하는 등의 역동적인 이미지를 포함하여 매우 사실적인 비디오를 생성할 수 있는 AI 도구 OmniHuman -1 을 출시했다고 보도했습니다.
연구 논문에서는 해당 기술이 약한 신호 입력(오디오 등)에서도 좋은 성능을 보이고, 모든 비율의 이미지 입력(헤드샷, 반신, 전신)을 지원하며, 고품질의 사실적인 비디오를 생성한다고 지적합니다. OmniHuman-1의 디스플레이 페이지에서는 자연스러운 얼굴 표정과 몸짓으로 칠판 앞에서 연설하는 아인슈타인의 영상 등 역사적 인물을 재현합니다.
남부 캘리포니아 대학교 커뮤니케이션 스쿨의 프레디 트랜 네이거 교수는 이 기술을 "매우 인상적"이라고 칭하며, 휴대폰과 같은 작은 화면에서 사용하면 효과가 특히 현실적이라고 말했습니다.
