この度、中国のAI生成創作プラットフォーム「可灵AI」が全面的に刷新された2.0バージョンを正式にリリースしました。今回のアップグレードは、複数の中核モデルの徹底的な更新を含むだけでなく、一連の画期的な新機能も追加され、このプラットフォームが多モーダルAI創作の新段階に突入したことを示しています。
今回の更新の中心は、2つの基盤モデルの全面的な刷新です。可灵2.0(マスター版)と可图2.0です。可灵2.0(マスター版)はビデオ生成に特化しており、意味応答、動的品質、画面の美しさの3つの点で質的な飛躍を遂げました。「少女が静かに座っているところからゆっくりと立ち去り、朝焼けから夕焼けへと変化する空を背景にしている」といった高度に複雑なシーン描写にも正確に対応できるようになりました。同時に、キャラクターの動作範囲が拡大し、動きがよりスムーズになり、恐竜がカメラに突進したり、スケートボーダーの動きなどの複雑な動きでも、プロレベルの自然さや合理性を表現できるようになりました。
可图2.0は静止画生成において大きなブレイクスルーを達成しました。新しいモデルは複雑な指示への遵守能力が大幅に向上し、複数の要素、色の位置などの詳細な要求に正確に対応できます。特に注目すべきは、可图2.0が60種類以上の芸術様式をサポートしていることで、特殊な素材からデジタルアート、様々な絵画技法まで、一般ユーザーでも簡単に高級映画のような質感と独特な美学的な画像を作成できます。
今回の更新の最大のハイライトは、新たに導入された多モーダル編集機能システムです。ビデオ編集では、1~5秒の短いビデオをアップロードし、テキストまたは画像指示を使用して、ビデオの要素の置換、追加、削除を行うことができます。例えば、ビデオ内の人物をパンダに置き換えたり、段ボール箱に人形を追加したり、画面から不要なオブジェクトを削除したりできます。このような精密なビデオ編集機能は、中国のAIプラットフォームの中でもトップレベルです。
同時に、画像編集機能も大幅に更新され、部分的な再描画と自由な拡大がサポートされるようになりました。ユーザーは画像内の特定の領域を指定して修正できます(例えば、人物にサングラスを追加するなど)。または、画像のサイズや構図を調整し、画像の内容を自由に拡張できます。システムが生成したコンテンツは元の画像との融合度が高く、創作効率と完成品の質が大幅に向上します。
もう一つの注目すべき新機能は「スタイル変換」です。画像をアップロードしてスタイルの説明を入力するだけで、画像をレトロな美少女風や3Dアニメ風など様々な芸術スタイルに変換でき、クリエイターにより豊かな表現の可能性を提供します。
今回の可灵AI 2.0バージョンのリリースは、中国のAI技術が多モーダルコンテンツ生成分野で急速に進歩していることを示すと同時に、AI創作ツールがより精密で専門的でパーソナライズされた方向へと進化していることを示しています。これらの新技術の普及に伴い、AIアシスト創作はより広範な分野で創造の可能性を開放し、コンテンツ創作業界に新たな変革をもたらすと期待されます。