12月19日、Googleは動画生成モデルVideoPoetを発表しました。このモデルは最長10秒の動画を生成でき、動画の内容に合わせて自動的にBGMと効果音も生成します。VideoPoetは動画の最終フレームの次のフレームを繰り返し予測することで動画を延長し、ユーザーに動画が無限に延長するように感じさせます。他のモデルとは異なり、VideoPoetは拡散モデルではなく大規模言語モデルを使用しているため、テキストから動画への変換、動画修復、動画のスタイル変更など、複数の機能を1つのモデルに統合しており、より柔軟に使用できます。