PANewsは2月6日、フォーブスによると、TikTokの親会社であるByteDanceが、1枚の写真から人が話したり、身振りをしたり、楽器を演奏したりするダイナミックな画像を含む、非常にリアルな動画を生成できるAIツール「OmniHuman-1 」をリリースしたと報じた。
研究論文では、この技術は弱い信号入力(音声など)でも良好に機能し、あらゆる比率の画像入力(ヘッドショット、半身、全身)をサポートし、高品質でリアルなビデオを生成できると指摘しています。ディスプレイページでは、OmniHuman-1は、黒板の前で話すアインシュタインの動画など、歴史上の人物も自然な表情や身振りで再現します。
南カリフォルニア大学コミュニケーション学部のフレディ・トラン・ネイガー教授は、この技術を「非常に印象的」と呼び、携帯電話のような小さな画面で使用した場合、その効果は特にリアルだと語った。
