Googleは、OpenAIのSoraと競合することを目指した、次世代ビデオ生成モデルVeo2を正式にリリースしました。Googleによると、Veo2はビデオ生成において、より高いリアリティと精細さを実現しています。今回のアップデートでは、ビデオ品質の向上だけでなく、現実世界の物理法則や、人間の動きや表情の微妙な違いに対する理解も強化されました。

image.png

Veo2の強力な機能

Googleによると、Veo2は「現実世界の物理学、そして人間の動きや表情の微妙な違いをより深く理解している」とのことです。Google LabsのVideoFXプラットフォームで使用できますが、ウェイティングリスト制です。Googleフォームに登録して、Googleが選択した時間に一時的にアクセス権限が付与されるのを待つ必要があります。

Googleの説明によると、ユーザーは必要に応じてビデオの種類、ショット、映画効果を選択でき、Veo2は最大4K解像度のビデオを生成できます

一方、元のVeoはVertex AIで引き続き使用できます。Veo2で生成されたビデオには、AI生成コンテンツであることを識別するためのGoogleのメタデータウォーターマークSynthIDが付加されます。

Veo2は技術的に進歩していますが、Googleは、余分な指を生成するなど、モデルが時折「幻覚」を起こすことを認めています。しかし、全体として、新バージョンでは幻覚現象が減少しています。

Googleによると、社内テストでは、「全体的な好み」(つまり、視聴者がどのビデオを好むか)と「指示への忠実度」(ビデオが人間のクリエイターからの指示と一致する程度)を測定した結果、人間の評価者はSoraや他の競合AIモデルよりもVeoを好む傾向がありました。

Veo2体験入口:https://labs.google/fx/tools/video-fx

紹介ページ:https://deepmind.google/technologies/veo/veo-2/

AIビデオ生成はまだ発展途上

AIビデオ生成技術は進歩を続けていますが、GoogleとOpenAIなどの大手企業間の競争は依然として激しく、RunwayMLやLuma AIなどの小規模企業も、ビデオ生成能力の強化に向けた新機能を次々と発表しています。

最近では、RunwayMLがGen-3Alpha Turboモデルの高度な制御機能を発表し、Pika LabsはPika2.0を発表して、ユーザーがビデオに自分のキャラクターを追加できるようにしました。

しかし、AI生成ビデオに対するユーザーの信頼度は依然として高くありません。Soraの発表によって疑問が完全に解消されたわけではなく、一部ユーザーからは物理的および解剖学的に不自然な結果が生成されたというフィードバックがあります。また、最近のゲーム授賞式では、AI生成コンテンツの「AIの混乱」に対する不満が表明されました。

Googleによると、多くのユーザー、特にYouTubeクリエイターの中には、短編ビデオの背景制作にVideoFXを使用し、時間を節約している人がいるなど、Veo2に強い関心を示しているとのことです。

Imagen3のアップデート 

Veo2に加えて、Googleは画像生成モデルImagen3もアップデートし、生成画像のリアリティと鮮やかさをさらに向上させました。新バージョンのImagen3は、写真写実主義から印象派、抽象画、アニメスタイルまで、幅広い芸術様式をより正確に表現できるようになり、ユーザーの指示に従う能力も向上しています。

要点:

- 🎥 GoogleがVeo2ビデオ生成モデルを発表。OpenAIのSoraよりもビデオ品質が優れていると主張。

- 🚀 ユーザーはGoogleフォームからVeo2の使用を申請でき、ビデオ生成時にスタイルやエフェクトを選択可能。

- 🎨 更新されたImagen3画像生成モデルは、様々な芸術様式をより効果的に表現し、ユーザーエクスペリエンスが向上。