Modelo de geração de vídeo PixelDance da ByteDance lançado integralmente no JiMeng AI; Musk dá um 'joinha'

AIbase基地

Publicado emNotícias e Informações de IA · 8 minutos de leitura · Nov 18, 2024

531

Finalmente, o modelo de geração de vídeo PixelDance da ByteDance está disponível para todos! Agora, os modelos de geração de vídeo PixelDance e Seaweed da ByteDance estão totalmente disponíveis no Jimeng AI. Os usuários podem acessar esses modelos poderosos através da versão web e do aplicativo móvel do Jimeng AI, selecionando "Vídeo P2.0Pro" ou "Vídeo S2.0Pro".

A geração de um vídeo de 5 segundos com qualquer um dos dois modelos consome 20 pontos, enquanto um vídeo de 10 segundos com o P2.0Pro consome 40 pontos.

O AIbase testou os modelos por um tempo e, em resumo, se você precisar de movimentos mais complexos, o P2.0Pro é a melhor opção. No entanto, o P2.0Pro é mais sensível às instruções (prompts). Para obter melhores resultados, é necessário dominar algumas técnicas de prompts.

Para movimentos menores, o S2.0Pro às vezes produz vídeos com resultados melhores do que o P2.0Pro, sendo mais amigável para iniciantes. Às vezes, você nem precisa de prompts; basta converter uma imagem em vídeo, e a IA automaticamente identifica as informações da imagem e as transforma em efeitos de vídeo apropriados.

De acordo com o feedback de vários criadores no teste interno, o P2.0Pro se destaca na geração de vídeos de 10 segundos, especialmente com 3 a 5 mudanças de câmera, mantendo a coerência de cena e personagem. Com ajustes precisos nos prompts, o modelo também pode criar efeitos especiais impressionantes. Os usuários podem usar prompts temporais e tomadas longas (técnicas avançadas) para melhorar a expressividade e a narrativa do vídeo.

Segue a experiência de teste do AIbase:

Primeiro, fornecemos uma imagem de um gato surfista. Os resultados do S2.0Pro e do P2.0Pro foram os seguintes:

Resultado S2.0Pro

Resultado P2.0Pro

Podemos ver que o S2.0Pro reproduz com precisão o estilo e as características de cor da imagem de entrada, enquanto o P2.0Pro às vezes apresenta desvios de cor. Em termos de movimento, ambos os modelos se saíram bem, sem problemas significativos.

Em seguida, testamos os modelos com Elon Musk:

Uma entrada simples: "Musk se aproxima da câmera e mostra o polegar para cima". Veja os resultados:

Resultado S2.0Pro

Resultado P2.0Pro

Em vídeos mais simples, a diferença entre os dois modelos não é tão grande, mas o P2.0Pro adicionou expressões a Musk, tornando-o mais vívido.

Vamos aumentar a dificuldade:

Um prompt longo e complexo: "A câmera se aproxima, focando em um jovem vestindo uma túnica branca. Ele segura uma espada antiga e tem uma expressão determinada. O vento sopra em seus cabelos, e o céu escurece gradualmente. Um enorme dragão negro-azulado desce das nuvens, suas escamas brilhando com uma luz fria."

Resultado S2.0Pro

Resultado P2.0Pro

Atualmente, o P2.0Pro segue mais os prompts, executando estritamente a primeira parte do prompt "A câmera se aproxima, focando em um jovem vestindo uma túnica branca", mas o movimento do dragão é um pouco pequeno. O resultado do S2.0Pro é mais aleatório, mas o movimento do dragão é melhor do que o do P2.0Pro. Na prática, os usuários podem usar os dois modelos de forma intercalada, de acordo com suas necessidades.

Vale notar que o Jimeng também possui um modelo de vídeo leve, o S2.0 (uma versão reduzida do S2.0Pro), que gera vídeos mais rapidamente. A qualidade às vezes é um pouco menor, mas a geração de um vídeo consome apenas 5 pontos. Pode-se dizer que tem uma melhor relação custo-benefício.

Segue o resultado sem nenhum prompt:

Experimente você mesmo: https://top.aibase.com/tool/jimeng

PixelDance Seaweed JiMeng AI Modelo de geração de vídeo

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Moonvalley anuncia investimento da Série B de US$ 43 milhões e lança o inovador modelo de geração de vídeo Marey

Apr 18, 2025

Alibaba lança o modelo de geração de vídeo Wan2.1-FLF2V-14B de alta definição 720p com frames iniciais e finais

A Alibaba anunciou recentemente o lançamento em código aberto de seu mais novo modelo de geração de vídeo com frames iniciais e finais, o Wan2.1-FLF2V-14B, que suporta a geração de vídeos HD de 720p com 5 segundos de duração. Este modelo, com sua inovadora tecnologia de controle de frames iniciais e finais, tem gerado grande interesse, abrindo novas possibilidades para o campo da geração de vídeo com IA. De acordo com o AIbase, o modelo foi lançado em fevereiro de 2025 nas plataformas GitHub e Hugging Face, disponível gratuitamente para desenvolvedores, pesquisadores e instituições comerciais em todo o mundo, marcando um marco na construção do ecossistema de IA de código aberto da Alibaba.

Apr 18, 2025

O modelo de geração de vídeo da OpenAI, Sora, agora está disponível na Europa

Feb 28, 2025

Alibaba lança modelo de geração de vídeo a partir de texto de código aberto, Wanxiang 2.1: versões de 14B e 1,3B disponíveis

Hoje, a Alibaba anunciou oficialmente o lançamento de código aberto completo de seu modelo de geração de vídeo Wanxiang 2.1, com versões de 14B e 1,3B disponíveis. A versão profissional de 14B oferece alto desempenho e expressividade de ponta, atendendo às necessidades de cenários com alta demanda de qualidade de vídeo; enquanto a versão ultrarrápida de 1,3B é compatível com placas de vídeo de consumo, permitindo a geração de vídeos de alta qualidade em 480P com apenas 8,2 GB de VRAM, ideal para desenvolvimento de modelos secundários e pesquisa acadêmica. De acordo com a empresa, o Wanxiang 2.1 apresenta melhorias no processamento de movimentos complexos, na reprodução de leis físicas reais e na melhoria da qualidade cinematográfica.

Feb 26, 2025

120

Boletim Diário de IA: Incrível! DeepSeek lançará cinco projetos de código aberto na próxima semana; O modelo de geração de vídeo WanX 2.1 do Alibaba Tongyi Wanxiang será de código aberto; Usuários ativos semanais do ChatGPT ultrapassam 400 milhões

Bem-vindo ao boletim diário de IA! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA. Descubra novos produtos de IA: https://top.aibase.com/1. Impressionante! Desde seu lançamento oficial em 11 de janeiro de 2025, o aplicativo atraiu um grande número de usuários com seu poderoso poder tecnológico e o modelo de inferência de código aberto DeepSeek-R1.

Feb 21, 2025

580

Alibaba anuncia o lançamento de código aberto do modelo de geração de vídeo WanX 2.1

Recentemente, a Alibaba alcançou um avanço significativo na área de inteligência artificial, anunciando oficialmente o lançamento do modelo de geração de vídeo WanX 2.1 de nova geração. Essa inovação tecnológica é considerada um marco no campo da geração de vídeo por IA, marcando o início de uma nova era de criação de vídeo a partir de texto, eficiente e inteligente. O novo modelo, por meio da tecnologia de fusão multimodal, consegue analisar com precisão semântica complexa, permitindo a geração simultânea de vídeos em alta definição, legendas dinâmicas e dublagem em vários idiomas. Seu principal avanço reside no aumento significativo da eficiência de geração — um vídeo de 1 minuto em 1080p leva apenas 15 segundos.

Feb 21, 2025

21.8k

Luma AI lança o modelo de geração de vídeo Ray2, oferecendo movimento mais rápido e natural

A Luma AI lançou recentemente o seu mais novo modelo de geração de vídeo, o Ray2, na sua plataforma de criação de vídeo com IA Dream Machine, atraindo ampla atenção da indústria. Desde o lançamento da Dream Machine no verão passado, o campo de vídeo com IA tem visto mudanças rápidas nos sete meses seguintes, com muitos novos modelos surgindo, incluindo Runway, Kling, Sora da OpenAI e Veo2 do Google. Ra

Jan 16, 2025

3.2k

Alimama lança o grande modelo de geração de vídeo Taobao Star e aplicativo de imagem para vídeo

Recentemente, a Alimama, com base em seu modelo de geração de vídeo Taobao Star, lançou oficialmente o aplicativo AI Native de imagem para vídeo de nível comercial — Taobao Star · Imagem para vídeo, e já está disponível para uso por comerciantes do Taobao e Tmall. Esta nova ferramenta AI Native combina dados massivos de e-commerce, linguagem de design rica e experiência de marketing líder do setor, com o objetivo de impulsionar a atualização inteligente de todo o processo de criação de conteúdo de IA para e-commerce.

Jan 14, 2025

4.2k

Luocheng Technology lança o novo Video Ocean V2.0: modelo de geração de vídeo gratuito evolui, criando vídeos HD de 20 segundos com um clique

Na era em que tudo pode ser IA, a criação de vídeo recebeu uma grande atualização. O Video Ocean V2.0, recém-lançado pela Luocheng Technology, não apenas é totalmente gratuito, mas também apresenta avanços revolucionários em qualidade de imagem, desempenho dinâmico e liberdade criativa. Este modelo de geração de vídeo, originário do projeto de código aberto Open Sora, já recebeu mais de 23.000 estrelas na comunidade de desenvolvedores. As obras criadas pelos usuários são impressionantes: de um panda gigante escalando a Grande Muralha a cenas divertidas com o Merlion, cada quadro é vívido e realista.

Jan 13, 2025

7.7k

Google aprimora o modelo de geração de vídeo com IA, Veo2, com resolução 4K e pontuação de preferência humana superior à Sora

O Google lançou oficialmente seu modelo de geração de vídeo de próxima geração, o Veo2, com o objetivo de competir com o Sora da OpenAI. O Google afirma que o Veo2 apresenta maior realismo e detalhe na geração de vídeos. Esta atualização não apenas melhorou a qualidade do vídeo, mas também aprimorou a compreensão da física do mundo real e das nuances do movimento e expressões humanas. O Google afirma que o Veo2 possui uma "melhor compreensão da física do mundo real e das nuances do movimento e expressões humanas". Ele está disponível no Google Labs

Dec 17, 2024

2.8k

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Modelo de geração de vídeo PixelDance da ByteDance lançado integralmente no JiMeng AI; Musk dá um 'joinha'

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Moonvalley anuncia investimento da Série B de US$ 43 milhões e lança o inovador modelo de geração de vídeo Marey

Alibaba lança o modelo de geração de vídeo Wan2.1-FLF2V-14B de alta definição 720p com frames iniciais e finais

O modelo de geração de vídeo da OpenAI, Sora, agora está disponível na Europa

Alibaba lança modelo de geração de vídeo a partir de texto de código aberto, Wanxiang 2.1: versões de 14B e 1,3B disponíveis

Boletim Diário de IA: Incrível! DeepSeek lançará cinco projetos de código aberto na próxima semana; O modelo de geração de vídeo WanX 2.1 do Alibaba Tongyi Wanxiang será de código aberto; Usuários ativos semanais do ChatGPT ultrapassam 400 milhões

Alibaba anuncia o lançamento de código aberto do modelo de geração de vídeo WanX 2.1

Luma AI lança o modelo de geração de vídeo Ray2, oferecendo movimento mais rápido e natural

Alimama lança o grande modelo de geração de vídeo Taobao Star e aplicativo de imagem para vídeo

Luocheng Technology lança o novo Video Ocean V2.0: modelo de geração de vídeo gratuito evolui, criando vídeos HD de 20 segundos com um clique

Google aprimora o modelo de geração de vídeo com IA, Veo2, com resolução 4K e pontuação de preferência humana superior à Sora