著者:鄭敏芳
出典:ウォールストリートニュース
海の向こうのOpenAIがAI生成モデルSoraの「一時停止ボタン」を押したように見える一方で、中国のテクノロジー大手はこの分野で反撃を開始した。
最近、ByteDanceは最新のAIビデオ生成モデルであるSeedance 2.0を発表しました。このモデルは、マルチモーダル入力、セルフカメラ操作、一貫性などの利点により、インターネット上で急速に話題になりました。
ゲームサイエンスの創設者であるフェン・ジ氏は、ゲームを徹底的に体験した後、重要な判断を下した。 「コンテンツ分野は、前例のないインフレを経験することになるだろう。」
馮吉の予測は根拠のないものではなかった。
この衝撃波は、電子商取引、ゲーム、ビデオプラットフォーム、映画制作などの業界に急速に広がっています。
- 電子商取引分野では、ローエンドのアウトソーシングや撮影拠点に対する技術的な障壁が完全に排除されました。
- ゲーム業界では、概念実証やユーザー獲得資料の制作サイクルが極限まで短縮され、競争がさらに激しくなっています。
- ビデオプラットフォームは、供給の急増に対処するために配信ロジックをさらに最適化する必要がありました。
- 映画やテレビ番組の制作における「撮影+編集」という伝統的な線形プロセスは、「プロンプトワード+生成」という産業化されたパイプラインによって壊滅的な打撃を受けています。
受益者と代替者をめぐる業界の大再編はすでに始まっている。
ビデオ制作能力の爆発的な増加
過去 1 年間、AI ビデオの最大の問題点は配信でした。
SORA、Runway、Kelingのような国内プラットフォーム、さらにはByteDanceが自社開発したJiMengなど、いずれもこの問題に悩まされています。クリエイターはしばしば「ガチャ」ゲームに巻き込まれ、一貫性のある途切れのない数秒の動画を作成するために何十回も動画を生成しなければなりません。
Seedance 2.0 の核心的な進歩は、「派手なスキル」を「配信可能な物語」に変換するという試みにあります。
主要な機能の進歩は、主に次の 3 つの側面に反映されます。
- まず、マルチモーダル入力に対応しています。All-Weather Technologyの実際のテストによると、Seedanceを初めて使用するユーザーは、わずか1元で自動更新を有効にするだけでSeedance 2.0をすぐに使用できます。テキスト、画像、動画、音声を参考資料としてサポートしているため、ほぼあらゆる形式の動画を入力できます。
- 第二に、ユーザーが物語を理解し、カメラの動きを自主的に学習するのに役立ちます。Seedance 2.0は「監督レベル」の思考力を発揮し、複雑な物語の論理を理解するだけでなく、カメラの指示を自動で行い、プッシュ、プル、パン、ティルトといったカメラの動きを実現します。動画はもはや単なる静止画の動きではなく、映画的な物語の論理を備えています。
- 第三に、画像の一貫性の問題があります。オールウェザーテクノロジーが市販されている複数のAI動画生成アプリケーションをテストしたところ、被写体の動きに合わせて顔の表情が歪んだり、背景がぼやけたり絡み合ったりするなどの問題が頻繁に発生することがわかりました。
しかし、デモビデオから判断すると、 Seedance 2.0 は主要な動作プロセス中に顔と視覚情報の一貫性を維持し、一貫したストーリーテリングを可能にしています。
これは、AIによる動画生成が玩具からツールへと変貌を遂げつつあることを意味します。動画生成を標準化された産業パイプラインへと転換するこの能力は、「誰もが監督になれる」というスローガンを単なる空虚なものではなくし、動画制作コストを大幅に削減することにもつながります。
馮吉氏はこの変化を説明するために「インフレ」という言葉を使った。
「一般動画の制作コストは、もはや映画・テレビ業界の伝統的な論理に従えなくなり、徐々にコンピューティング能力の限界費用に近づいていくでしょう。コンテンツ分野は必然的に前例のないインフレを迎え、伝統的な組織構造や制作プロセスは徹底的に再構築されるでしょう。この予測が決して根拠のないものではないことは、実際に利用した人なら誰でもすぐに理解できると思います」と馮吉氏は述べた。
影響の第一波
ビデオ制作の限界費用がゼロに近づくと、既存のコスト構造に基づいて構築されたビジネス モデルが最初に影響を受けることになります。
電子商取引、ゲーム、ビデオプラットフォーム、映画・テレビ番組制作が最初に影響を受ける分野となる可能性が高い。
最も直接的な影響は、まず電子商取引分野で感じられました。
製品のデモンストレーション、シーンの描写、機能の説明ビデオは、複雑な芸術的な物語ではなく、明確な情報伝達に依存します。
Seedance 2.0の普及により、企業の動画表現における障壁は完全に取り除かれました。これまで「情報格差」と「技術障壁」に頼って生き延びてきたローエンドの動画アウトソーシング企業やタオバオの撮影拠点は厳しい冬を迎え、動画制作は専門的なアウトソーシングサービスから企業自身の日常業務へと移行していく可能性があります。
電子商取引と比較すると、AI ビデオ生成モデルのゲームへの影響は比較的限られているかもしれませんが、革命はすでに静かに始まっています。
世界観構築、概念実証、有料ユーザー獲得のための資料・動画制作にかかるコストは飛躍的に減少しています。より多くのプロジェクトが早期段階で検証され、早期段階で排除されるようになるでしょう。
北京に拠点を置くゲーム会社の内部関係者は、同社はすでにSeedance 2.0の小規模なテストを開始しているとAll-Weather Technologyに語った。
AI ビデオ生成モデルは、ビデオ プラットフォームの配信ロジックも変えています。
DouyinやKuaishouのようなプラットフォームでは、Seedance 2.0などのモデルによって生成された動画がコンテンツ供給の爆発的な増加をもたらし、プラットフォームのコア競争力を「選別と配信」メカニズムへと完全に移行せざるを得なくなりました。例えば、膨大なAI生成コンテンツからより正確に宝石を抽出できるアルゴリズム、そしてより高い商業的変換効率を持つアルゴリズムが勝利を収めるでしょう。
映画やテレビ業界では、Seedance 2.0 のマルチカメラ ストーリーテリング機能が制作プロセスに新たな形を与える可能性があります。
かつて、映画やテレビ番組の制作は、まず大量の映像を撮影し、その後編集者がポストプロダクション室で選択、組み立て、物語の論理を構築するという、厳密な線形工業プロセスに従うことが多かった。
しかし、Seedance 2.0 のロジックでは、この境界が曖昧になっています。
撮影プロセスでは、AIモデルによってセットデザインを低コストで生成できる可能性があります。モデル自体はカメラの動きや物語のリズムを理解しており、ビデオが生成された瞬間に「編集」作業が同時に完了します。
AI は、単に散らばった映像を吐き出すのではなく、一貫した時間的および空間的関係を持つ「完成した映画」を直接提供します。
これは、従来の映画やテレビ番組制作における時間のかかるポストプロダクション編集段階が、アルゴリズムによって「次元削減」される危険性があることを意味します。
将来のクリエイティブワークフローは、「撮影+編集」ではなく、「キューワード+生成」になるかもしれません。編集者の役割は「オペレーター」から「指示エンジニア」、あるいは「美的ゲートキーパー」へと移行するでしょう。
Seedance 2.0 で生成されるビデオは完璧ではなく、論理的な詳細とビジュアルにはまだ改善の余地がありますが、技術の反復のペースが市場の予想をはるかに上回っていることを考えると、これらの課題は近い将来に障害にはならないでしょう。
IPの「堀」
Seedance 2.0 の驚くべき「複製」能力により、一般の人々が創作の楽しみを享受できると同時に、著作権保有者に対して前例のないプレッシャーもかけています。
最近、短編動画プラットフォーム上で、チャウ・シンチーの名作映画の「リミックス」や「パロディ」クリップが多数拡散している。
AIビデオ生成モデルの計算能力により、周星馳(チャウ・シンチー)の表情、特徴的な笑い声、さらには古典的な会話スタイルまでが、多数のユーザーによって低コストで再現され、これまでになかった突飛なプロットも数多く生成されました。
これはすぐに、チャウ・シンチーのチームの注目を集めました。
周星馳(チャウ・シンチー)の代理人である陳振宇(チェン・ジェンユー)氏は、公にこう疑問を呈した。 「お伺いしたいのですが、これは著作権侵害に当たるのでしょうか(特にこの2日間の大規模な拡散を考慮すると)。クリエイターはすでに利益を得ていると思いますが、このプラットフォームはユーザーが何の監視もなくこれらのコンテンツを作成し、公開することを許可しているだけなのでしょうか?」
この質問は、一見、AI時代の著作権不安を明らかにしているように見えますが、実際には、より深いビジネスの観点から、AI時代のトップクラスのIPが極端に不足していることを示しています。
将来、AI 生成コンテンツが氾濫する中、誰もが同じ Seedance 2.0 ツールにアクセスできるようになるため、テクノロジー自体は障壁ではなくなります。
本当の障壁は依然として IP 所有者にあります。
市場には、チャウ・シンチーの「高品質な模倣品」が大量に溢れているからこそ、「本物のチャウ・シンチー」というかけがえのない知的財産の重要性が、より一層明らかになるのだ。
コンテンツの供給が過剰であるだけでなく「インフレ」状態にある場合、ユーザーの時間と注意力はかつてないほど高価になります。ユーザーの関心を瞬時に惹きつけるのは、時代を超えて愛され、強い感情的共鳴を持つ定番IPです。
つまり、 AIは生産の参入障壁を下げると同時に、「認識」の価値を限りなく高めるのです。
IP保有者にとって、未来は明るいままです。長年にわたり蓄積されたIP資産は、もはや単なる侵害の対象にとどまらず、公式ライセンスの活用、AIの活用、そして無数のクリエイターへのリーチを通じて、飛躍的な商業価値の向上を実現できるでしょう。
2024年2月にリリースされ、60秒の動画生成をサポートする世界初のAI動画生成モデルとなったOpenAIのSora 1.0から、マルチモーダル入力から60秒のネイティブオーディオナレーション映画を生成するByteDanceのSeedance 2.0まで、わずか2年しか経っていません。
急速な技術発展の時代において、あらゆる産業が岐路に立っています。実行コストは限りなく圧縮され、人手と長時間労働に依存する反復的な仕事は容赦なく置き換えられる一方で、知的財産と創造性の価値は限りなく増幅されています。
ツールが容易に利用できるようになると、コンテンツの質を決めるのは、ソフトウェアの使い方を知っているかどうかではなく、頭の中にある世界の概念が十分に独特であるかどうかになります。

