O Google lançou oficialmente seu modelo de geração de vídeo de nova geração, Veo2, com o objetivo de competir com o Sora da OpenAI. O Google afirma que o Veo2 apresenta maior realismo e detalhes na geração de vídeos. Esta atualização não apenas melhorou a qualidade do vídeo, mas também fortaleceu a compreensão da física real e das nuances do movimento e expressões humanas.

image.png

Recursos poderosos do Veo2

O Google afirma que o Veo2 "tem uma melhor compreensão da física do mundo real e das nuances do movimento e expressões humanas". Ele pode ser usado na plataforma VideoFX do Google Labs, mas apenas por meio de uma lista de espera. Os usuários precisam se registrar por meio de um formulário do Google e aguardar que o Google conceda acesso temporário no horário escolhido.

O Google informou que os usuários podem escolher o tipo de vídeo, ângulo e efeitos cinematográficos de acordo com suas necessidades. O Veo2 poderá gerar vídeos com resolução de até 4K.

Em comparação, o Veo original ainda está disponível no Vertex AI, e os vídeos gerados pelo Veo2 incluirão a marca d'água de metadados SynthID do Google para identificar o conteúdo como gerado por IA.

Apesar do progresso tecnológico do Veo2, o Google também admite que o modelo ocasionalmente apresenta "alucinações", como gerar dedos extras, mas, em geral, a ocorrência de alucinações na nova versão foi reduzida.

O Google afirma que, em seus testes internos, na avaliação de "preferência geral" (ou seja, quais vídeos os espectadores preferiram) e "adesão pontual" (o quão bem o vídeo correspondeu às instruções fornecidas pelos criadores humanos), os avaliadores humanos preferiram o Veo em comparação com o Sora e outros modelos de IA concorrentes.

Acesso ao Veo2: https://labs.google/fx/tools/video-fx

Página de apresentação: https://deepmind.google/technologies/veo/veo-2/

A geração de vídeo por IA ainda requer esforços

Embora a tecnologia de geração de vídeo por IA esteja em constante progresso, a competição entre grandes empresas como Google e OpenAI continua acirrada. Outras empresas menores, como RunwayML e Luma AI, também estão constantemente lançando novos recursos para melhorar suas capacidades de geração de vídeo.

Recentemente, a RunwayML lançou recursos de controle avançado para o modelo Gen-3Alpha Turbo, enquanto o Pika Labs lançou o Pika2.0, permitindo que os usuários adicionem seus próprios personagens aos vídeos.

No entanto, a confiança dos usuários em vídeos gerados por IA ainda é baixa. O lançamento do Sora não eliminou completamente as dúvidas, com alguns usuários relatando resultados que violam a física e a anatomia. Além disso, em uma recente premiação de jogos, os espectadores expressaram insatisfação com a "confusão de IA" do conteúdo gerado por IA.

O Google afirma que muitos usuários mostraram grande interesse no Veo2, especialmente alguns criadores do YouTube, que já estão usando o VideoFX para criar fundos para seus vídeos curtos, economizando tempo.

Atualização do Imagen3 

Além do Veo2, o Google também atualizou seu modelo de geração de imagens Imagen3, melhorando ainda mais o realismo e a vivacidade das cores das imagens geradas. A nova versão do Imagen3 consegue representar com mais precisão diversos estilos artísticos, do fotorrealismo ao impressionismo, passando pelo abstrato e o estilo anime. Ao mesmo tempo, o modelo também melhorou no cumprimento das instruções do usuário.

Destaques:

- 🎥 O Google lança o modelo de geração de vídeo Veo2, alegando que a qualidade do vídeo é superior à do Sora da OpenAI.

- 🚀 Os usuários podem solicitar o uso do Veo2 por meio de um formulário do Google, podendo escolher o estilo e os efeitos ao gerar vídeos.

- 🎨 O modelo de geração de imagens Imagen3 atualizado consegue representar melhor vários estilos artísticos, proporcionando uma melhor experiência ao usuário.