本日開催された百度雲智大会で、生数科技の共同創業者兼CEOである唐家渝氏は、同社が開発した中国初のビデオ大規模言語モデル「Vidu」のAPIを正式に公開し、百度スマートクラウド千帆大規模言語モデルプラットフォームに統合されたことを発表しました。これは、同プラットフォームに統合された最初のビデオ大規模言語モデルとなります。
今すぐ、Vidu公式サイト(www.vidu.studio)または百度スマートクラウド千帆大規模言語モデルプラットフォーム(qianfan.cloud.baidu.com)にアクセスして、体験版を申請できます。
Viduは独自のビデオ生成技術を採用しており、高い動的性、多様なスタイル、極めて高い推論能力などの優れた特長を備えています。また、世界に先駆けて「主体参照」機能を導入し、ビデオモデルの一貫性のある生成という課題を効果的に解決しました。7月末の公開以来、数万社もの企業ユーザーから導入申請が寄せられています。
Vidu APIの公開により、映画、アニメーション、広告などの業界におけるビデオ制作が加速し、規模拡大の可能性が解き放たれると予想されます。企業はコスト削減、効率向上を実現し、革新的なアイデアを生み出すことができます。Viduは猫眼映画などの企業とすでに連携しており、映画「熊猫計画」向けにパーソナライズされた短編ビデオコンテンツを制作し、宣伝効果を大幅に向上させました。
広告業界では、Viduは商品画像1枚から効率的に広告ビデオ素材を生成し、従来の実写撮影や後処理に取って代わることで、制作コストを大幅に削減します。
Vidu APIの公開は、生数科技による事業化戦略における重要な一歩です。APIを通じて、Viduのビデオ生成能力は様々な業界に迅速に統合され、企業のビデオコンテンツ制作ニーズに応え、アプリケーションのイノベーションを加速させます。
生数科技と百度スマートクラウドの連携により、両社の産業資源の相乗効果が最大限に発揮されます。百度スマートクラウド千帆大規模言語モデルプラットフォームの1日あたりの呼び出し回数は7億回を超え、累計で3万以上のモデルの微調整を支援し、70万以上のAIネイティブアプリケーションが開発されています。Viduの統合により、プラットフォームユーザーは世界をリードするビデオ生成能力を利用できるようになります。
さらに、Viduはモデルトレーニングにおいて百度百舸・AI異種計算プラットフォームを選択しており、その強力な計算能力とリソーススケジューリングシステムを活用することで、トレーニング効率が大幅に向上しています。