本日、北京生数科技はAI動画生成モデル「Vidu」の公式サイトを世界的に公開しました。Viduは、人工知能技術を利用して、テキストまたは画像から動画を生成するモデルです。
今年4月、生数科技と清華大学は共同で、中国初の動画大規模モデル「Vidu」を発表しました。これは、中国における動画生成技術の重要な一歩を意味します。
「Vidu」は、チーム独自のU-ViTアーキテクチャを採用しています。このアーキテクチャは、DiffusionとTransformer技術を融合しています。この革新的な動画大規模モデルは、最長16秒、1080Pの高解像度動画を高速に生成でき、同時に現実の物理世界をシミュレートしながら、非常に高い想像力と創造性を発揮します。複数のカメラアングルからの生成能力と時空間の一貫性が、「Vidu」の顕著な特徴です。
公開以来、「Vidu」は世界的に大きな進歩を遂げ、その性能は国際的なトップレベルに達しており、現在も継続的に改良と最適化が行われています。この成果は、チームのベイズ機械学習とマルチモーダル大規模モデル分野における深い蓄積、そして数々の独創的な成果によるものです。
U-ViTアーキテクチャに対する深い理解と豊富なエンジニアリング、データ経験を活かし、チームは長尺動画の表現と処理における重要な技術的課題を迅速に克服し、「Vidu」動画大規模モデルの開発に成功しました。「Vidu」は動画の連続性と動的な表現を大幅に向上させ、動画処理技術の発展を推進しています。
体験アドレス:https://www.vidu.studio/