Sora
大規模ビデオ生成拡散モデル
世界的トレンドビデオビデオ生成テキスト制御
Soraは、大規模データで学習されたテキスト制御型ビデオ生成拡散モデルです。1分間の高解像度ビデオ生成が可能で、幅広い視覚データの種類と解像度に対応します。ビデオと画像の圧縮潜在空間で学習することで、時空間的位置パッチに分解し、スケーラブルなビデオ生成を実現しています。また、三次元の一貫性やインタラクションなど、物理世界とデジタル世界の挙動をある程度シミュレートできる能力を示しており、高性能シミュレータの開発に向けて、ビデオ生成モデルの大規模化が有望であることを示唆しています。
Sora 最新のトラフィック状況
月間総訪問数
505000892
直帰率
59.23%
平均ページ/訪問
2.2
平均訪問時間
00:01:47