Finalmente, o modelo de geração de vídeo PixelDance da ByteDance está disponível para todos! Agora, os modelos de geração de vídeo PixelDance e Seaweed da ByteDance estão totalmente disponíveis no Jimeng AI. Os usuários podem acessar esses modelos poderosos através da versão web e do aplicativo móvel do Jimeng AI, selecionando "Vídeo P2.0Pro" ou "Vídeo S2.0Pro".

image.png

A geração de um vídeo de 5 segundos com qualquer um dos dois modelos consome 20 pontos, enquanto um vídeo de 10 segundos com o P2.0Pro consome 40 pontos.

O AIbase testou os modelos por um tempo e, em resumo, se você precisar de movimentos mais complexos, o P2.0Pro é a melhor opção. No entanto, o P2.0Pro é mais sensível às instruções (prompts). Para obter melhores resultados, é necessário dominar algumas técnicas de prompts.

image.png

Para movimentos menores, o S2.0Pro às vezes produz vídeos com resultados melhores do que o P2.0Pro, sendo mais amigável para iniciantes. Às vezes, você nem precisa de prompts; basta converter uma imagem em vídeo, e a IA automaticamente identifica as informações da imagem e as transforma em efeitos de vídeo apropriados.

De acordo com o feedback de vários criadores no teste interno, o P2.0Pro se destaca na geração de vídeos de 10 segundos, especialmente com 3 a 5 mudanças de câmera, mantendo a coerência de cena e personagem. Com ajustes precisos nos prompts, o modelo também pode criar efeitos especiais impressionantes. Os usuários podem usar prompts temporais e tomadas longas (técnicas avançadas) para melhorar a expressividade e a narrativa do vídeo.

Segue a experiência de teste do AIbase:

Primeiro, fornecemos uma imagem de um gato surfista. Os resultados do S2.0Pro e do P2.0Pro foram os seguintes:

Resultado S2.0Pro

Resultado P2.0Pro

Podemos ver que o S2.0Pro reproduz com precisão o estilo e as características de cor da imagem de entrada, enquanto o P2.0Pro às vezes apresenta desvios de cor. Em termos de movimento, ambos os modelos se saíram bem, sem problemas significativos.

Em seguida, testamos os modelos com Elon Musk:

Uma entrada simples: "Musk se aproxima da câmera e mostra o polegar para cima". Veja os resultados:

Resultado S2.0Pro

Resultado P2.0Pro

Em vídeos mais simples, a diferença entre os dois modelos não é tão grande, mas o P2.0Pro adicionou expressões a Musk, tornando-o mais vívido.

Vamos aumentar a dificuldade:

Um prompt longo e complexo: "A câmera se aproxima, focando em um jovem vestindo uma túnica branca. Ele segura uma espada antiga e tem uma expressão determinada. O vento sopra em seus cabelos, e o céu escurece gradualmente. Um enorme dragão negro-azulado desce das nuvens, suas escamas brilhando com uma luz fria."

Resultado S2.0Pro

Resultado P2.0Pro

Atualmente, o P2.0Pro segue mais os prompts, executando estritamente a primeira parte do prompt "A câmera se aproxima, focando em um jovem vestindo uma túnica branca", mas o movimento do dragão é um pouco pequeno. O resultado do S2.0Pro é mais aleatório, mas o movimento do dragão é melhor do que o do P2.0Pro. Na prática, os usuários podem usar os dois modelos de forma intercalada, de acordo com suas necessidades.

Vale notar que o Jimeng também possui um modelo de vídeo leve, o S2.0 (uma versão reduzida do S2.0Pro), que gera vídeos mais rapidamente. A qualidade às vezes é um pouco menor, mas a geração de um vídeo consome apenas 5 pontos. Pode-se dizer que tem uma melhor relação custo-benefício.

Segue o resultado sem nenhum prompt:

Experimente você mesmo: https://top.aibase.com/tool/jimeng