A Kuaishou Technology Co., Ltd., sediada em Pequim, anunciou recentemente que sua API de modelo de linguagem de grande escala de geração visual, Kling (可灵AI), concluiu uma nova rodada de atualizações de recursos. A API Kling aprimorada apresentou avanços significativos em duas principais funções: prova virtual e sincronização labial, fornecendo suporte técnico mais robusto para clientes nos setores de comércio eletrônico, marketing de publicidade, entretenimento geral e ferramentas de IA.
Na área de prova virtual, o modelo V1.5 do Kling não apenas consegue processar a entrada de uma única peça de roupa, mas também adicionou suporte para combinações de "top + bottom". Essa atualização permite que o sistema capture e preserve precisamente cada detalhe da roupa. Combinado com a função de geração de vídeo a partir de imagem, os usuários podem gerar vídeos de prova de roupa naturais e fluidos, aumentando significativamente o realismo e a praticidade da experiência de prova virtual.
Além disso, a capacidade de sincronização labial do Kling foi totalmente liberada, podendo sincronizar perfeitamente a boca dos personagens no vídeo com arquivos de dublagem ou canto locais, bem como com dublagens geradas online. Essa função torna as imagens de vídeo geradas vívidas e realistas, alcançando o efeito de uma pessoa falando ou cantando de verdade, abrindo novas possibilidades para a criação de conteúdo de vídeo.
A Kuaishou Technology Co., Ltd. afirmou que essas atualizações ajudarão os usuários corporativos a dar novos passos no crescimento de seus negócios e também demonstram a poderosa capacidade e inovação do Kling na área de geração visual. Com esses novos recursos, os usuários podem concluir facilmente e eficientemente várias criações artísticas, impulsionando a inovação e o desenvolvimento de conteúdo visual.