最近、生数科技と清華大学が共同開発した中国初の純国産オリジナルビデオ大規模言語モデル「Vidu」に、「主体参照」機能が追加されました。この機能により、任意の主体の一貫性のある生成が可能になり、ビデオ生成がより安定し、制御しやすくなります。現在、この機能はユーザーに無料で提供されています。
「主体参照」機能は、AIによるビデオ生成におけるキャラクターの一貫性問題を解決します。任意の主体の画像をアップロードするだけで、Viduはその主体のイメージをロックし、説明文によってシーンを自由に切り替え、主体が一致したビデオを出力します。
この機能は単一オブジェクトのみに限定されず、「任意の主体」に対応しています。人物、動物、商品、アニメキャラクター、架空の主体など、ビデオ生成における一貫性と制御性を確保できます。
生数科技の会長兼CEOである唐家渝氏は、「主体参照」機能はAIによる完全なナラティブの始まりを象徴しており、AIビデオ制作はより効率的で柔軟な段階へと進むだろうと述べています。
また、中央广播电视総台のディレクターであり、AIGCアーティストである石宇翔氏は、アニメーション短編映画「夏の贈り物」を制作し、「主体参照」機能によって静止画の制約から解放され、生成された映像はより感染力と自由度が増し、制作の一貫性が大幅に向上したと述べています。
この機能の登場は、AIビデオ制作が新たな時代に入ったことを示しています。今後は、複数の主体のインタラクション、スタイルの一貫性、変化に富むシーンの安定した切り替えなど、より複雑な要素を正確に制御する方法を模索し、より高度なナラティブのニーズに応えていきます。