愛詩科技は先日、AIビデオ大規模モデルに基づいた革新的なツール、ビデオ生成製品PixVerse V2を発表しました。これは、ユーザーの創造性を解き放つことを目的としています。PixVerse V2はDiffusion+Transformer(DiT)の基本アーキテクチャを採用し、複数の点で技術革新を行い、ビデオ生成をよりスムーズで、一貫性があり、楽しくしています。
主な特徴は以下の通りです。
時空間的注意機構:PixVerse V2は独自開発の時空間的注意機構を導入し、空間と時間に対する認識能力を向上させました。特に複雑なシーンの処理において優れた性能を発揮します。
テキスト理解能力:多様なモダリティモデルを通じて、PixVerse V2はテキスト情報とビデオ情報をより正確に整合させることができ、モデルの理解力と表現力を強化しています。
最適化されたモデルトレーニング:従来のflowモデルを基に、PixVerse V2は加重損失を用いることで、モデルの収束をより迅速かつ最適化し、全体的なトレーニング効率を向上させています。
ビデオ生成能力:PixVerse V2は一度に複数のビデオクリップを生成でき、単一クリップは最大8秒、複数クリップは最大40秒に達し、同時にクリップ間の一貫性を維持します。
ユーザーフレンドリーな機能:PixVerse V2はワンクリックで1~5個の連続したビデオコンテンツを生成でき、クリップ間で主題、画風、シーン要素の一貫性を保ちます。さらに、ユーザーは生成結果を二次編集して、ビデオコンテンツを柔軟に置き換えたり調整したりできます。
愛詩科技チームは今後3ヶ月以内に複数回の反復的なアップグレードを行い、より優れたAIビデオ生成体験を提供する予定です。PixVerse V2の目標は、AIビデオ制作をより便利で効率的にすることです。日常生活の記録からビデオストーリーの制作まで、簡単に実現できます。