人工知能の分野では、技術革新のスピードは常に驚異的です。快手(Kuaishou)傘下のAI動画生成ツール「可灵(Kling)」は、わずか半年で追随者から世界的なAI動画生成分野のリーダーへと躍進しました。最新版1.6では、目覚ましい技術進歩が示されています。

バージョン番号はわずか0.1のアップグレードですが、可灵1.6版がもたらす技術的ブレークスルーは予想をはるかに超えています。35アイデア/5秒動画という親しみやすい価格を維持しながら、物理法則のリアルさ、人物の演技力、意味理解レベルという3つの主要な側面で質的な飛躍を遂げました。

QQ20241219-111043.jpg

物理法則のリアルさが大幅に向上

物理世界の正確な描写がこのアップデートの最大の魅力です。トマトの切断テストでは、可灵1.6版はプロの料理人並みの正確な操作を見せ、ナイフと食材の相互作用、切断の力加減ともに感嘆させられます。お茶を注ぐ、猫がソファに飛び乗る、犬が走るなど、日常的なシーンでの物理効果もよりリアルになっています。バットマンが車で走るときのマントの揺れも映画のような雰囲気で、リアルさと芸術性を兼ね備えています。

人物の表情と動作の進歩も同様に素晴らしいです。微妙な眉間の皺から優雅なバレエのポーズ、そして非常に難易度の高い中国古典の水中舞踊まで、可灵1.6版は人物の微妙な感情の変化や複雑な体の動きを正確に捉えることができます。河南衛視の「洛神」の水中舞踊シーンの再現では、舞踊家の動作の幅や衣装の帯の物理効果が驚くべきレベルに達しています。

意味理解の面では、可灵1.6版はより強力なシーン理解能力を示しています。「眼鏡を外して小鹿を抱きしめる」といった連続動作、「後ずさりして銃を構える」といった複雑なシーンでも、期待通りの動画コンテンツを正確に理解して生成し、複雑な指示に対する優れた解析能力を示しています。

もちろん、0.1バージョンアップであるため、可灵1.6版にはまだ改善の余地があります。例えば、元の画像以外のコンテンツを生成する場合、画風の統一性を強化する必要があります。複数人物のシーンにおける手の詳細な処理も改善が必要です。しかし、これらの欠点は全体的な優れた点に影響を与えません。今回のアップデートは、可灵チームの確かな技術力と迅速な反復開発能力を十分に示しています。

6月の正式リリース以来、可灵はわずか半年で「中国のSora」から「世界の可灵」へと変貌を遂げました。世界的なAI動画生成分野において、快手出身のこの製品は、中国のテクノロジーによる新たな章を書き綴っています。2.0バージョンでは、可灵がさらに多くの驚きを与えてくれると確信しています。