Recentemente, a plataforma chinesa de criação de IA KeLing AI lançou oficialmente sua versão 2.0 totalmente renovada. Esta atualização abrange não apenas atualizações completas de vários modelos principais, mas também uma série de novos recursos inovadores, marcando a entrada oficial da plataforma em uma nova fase de criação de IA multimodal.
O núcleo desta atualização são as reformas completas de dois modelos básicos: KeLing 2.0 (versão mestre) e KeTu 2.0. O KeLing 2.0 (versão mestre) concentra-se na geração de vídeo, alcançando um salto qualitativo em três aspectos: resposta semântica, qualidade dinâmica e beleza da imagem. Este modelo agora pode responder precisamente a descrições temporais mais complexas, como "uma garota passando de sentada a lentamente se afastando, acompanhada pela mudança do céu do amanhecer ao entardecer", descrevendo cenários altamente complexos. Ao mesmo tempo, a amplitude dos movimentos dos personagens é maior, a velocidade é mais suave e mesmo ações complexas, como um dinossauro correndo em direção à câmera ou as trajetórias de movimento de um skatista, podem ser apresentadas com naturalidade e razoabilidade de nível profissional.
O KeTu 2.0 obteve um grande avanço na geração de imagens estáticas. A capacidade do novo modelo de seguir instruções complexas melhorou significativamente, podendo responder com precisão a vários elementos, cores, posições e outros requisitos de detalhes. Particularmente notável é que o KeTu 2.0 suporta mais de 60 estilos artísticos, desde materiais especiais e arte digital até várias técnicas de pintura, permitindo que usuários comuns criem facilmente imagens com uma qualidade cinematográfica avançada e uma estética única.
O maior destaque desta atualização é o novo sistema de funções de edição multimodal. Na edição de vídeo, os usuários podem enviar vídeos curtos de 1 a 5 segundos e usar instruções de texto ou imagem para substituir, adicionar ou excluir elementos do vídeo, como substituir uma pessoa no vídeo por um panda, adicionar um brinquedo a uma caixa ou remover objetos indesejados da imagem. Essa capacidade de edição de vídeo precisa está em posição de liderança entre as plataformas de IA chinesas.
Ao mesmo tempo, a função de edição de imagem também recebeu uma grande atualização, suportando redesenho parcial e expansão livre. Os usuários podem especificar áreas específicas da imagem para modificação, como adicionar óculos de sol a uma pessoa; ou ajustar o tamanho e a composição da imagem, expandindo livremente o conteúdo da imagem. O conteúdo gerado pelo sistema tem alta compatibilidade com a imagem original, melhorando significativamente a eficiência da criação e a qualidade do produto.
Outro novo recurso notável é a "conversão de estilo". Basta enviar uma imagem e inserir uma descrição de estilo para converter a imagem em vários estilos artísticos, como estilo retrô de garota bonita ou estilo de desenho animado 3D, oferecendo aos criadores possibilidades de expressão mais ricas.
O lançamento da versão 2.0 do KeLing AI não apenas reflete o rápido progresso da tecnologia de IA chinesa na geração de conteúdo multimodal, mas também representa a tendência de desenvolvimento de ferramentas de criação de IA em direção a uma direção mais precisa, profissional e personalizada. Com a popularização dessas novas tecnologias, a criação assistida por IA poderá liberar o potencial criativo em áreas mais amplas, trazendo uma nova onda de transformação para a indústria de criação de conteúdo.