北京快手科技有限公司は先日、独自開発の視覚生成大規模モデル「可灵AI(Kling)」APIの能力アップグレードを発表しました。アップグレード後の可灵AI APIは、バーチャル試着と口パクの2つの機能で著しい進歩を遂げ、EC、広告マーケティング、エンターテインメント、AIツール分野の顧客に、より強力な技術サポートを提供します。
バーチャル試着分野において、可灵AIのV1.5モデルは、単一の衣類の入力に対応できるだけでなく、「上着+下着」の組み合わせ衣類にも対応できるようになりました。このアップグレードにより、システムは衣類の細部を正確に捉え、保持できるようになり、動画生成機能と組み合わせることで、ユーザーは自然で滑らかな試着動画を生成できます。これにより、バーチャル試着体験のリアル感と実用性が大幅に向上します。
さらに、可灵AIの口パク機能も全面的に開放され、ローカルの吹き替えまたは歌唱ファイル、そしてオンラインで生成された吹き替えに基づいて、動画内の人物の口パクと完璧に同期させることができます。この機能により、生成された動画は生き生きとしたリアルな話し声や歌声を実現し、動画コンテンツ制作に新たな可能性をもたらします。
快手科技有限公司は、これらのアップグレードが企業ユーザーの事業成長に貢献するとともに、可灵AIの視覚生成分野における強力な能力と革新性を示すものだと述べています。これらの新機能により、ユーザーは様々な芸術作品を簡単かつ効率的に作成し、視覚コンテンツの革新と発展を促進することができます。