Google apresenta tecnologia de ponta em IA: AI ajuda a "refilmar" vídeos já gravados, com efeitos de pós-produção profissionais ao alcance das mãos

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Nov 12, 2024

168

A equipe de pesquisa do Google lançou recentemente a tecnologia ReCapture, que está revolucionando a edição de vídeo tradicional. Essa inovação permite que usuários comuns realizem ajustes profissionais de movimento de câmera com facilidade, redesenhando a linguagem cinematográfica de vídeos já gravados.

Na pós-produção de vídeo tradicional, alterar o ângulo de câmera de um vídeo já gravado sempre foi um desafio técnico. As soluções existentes, ao lidar com diferentes tipos de conteúdo de vídeo, geralmente têm dificuldade em manter simultaneamente efeitos de câmera complexos e detalhes da imagem. A ReCapture utiliza uma abordagem diferente, não empregando o método tradicional de representação intermediária 4D, mas sim aproveitando inteligentemente o conhecimento de movimento armazenado em modelos de vídeo generativos, redefinindo a tarefa como um processo de conversão de vídeo para vídeo por meio do Stable Video Diffusion.

Este sistema utiliza um fluxo de trabalho de duas etapas. A primeira etapa gera um "vídeo âncora", ou seja, uma versão de saída inicial com a nova posição da câmera. Esta etapa pode ser realizada criando vídeos multiangulares por meio de modelos de difusão como o CAT3D, ou por meio de estimativa de profundidade quadro a quadro e renderização de nuvem de pontos. Embora esta versão possa apresentar alguma inconsistência temporal e defeitos visuais, ela estabelece a base para a segunda etapa.

A segunda etapa aplica o ajuste fino de vídeo com máscara, utilizando modelos de vídeo generativos treinados em materiais existentes para criar efeitos de movimento e mudanças temporais realistas. O sistema introduz uma camada temporal LoRA (Low-Rank Adaptation) para otimizar o modelo, permitindo que ele compreenda e replique as características dinâmicas específicas do vídeo âncora, sem precisar treinar todo o modelo novamente. Simultaneamente, a camada espacial LoRA garante que os detalhes e o conteúdo da imagem sejam consistentes com o novo movimento da câmera. Isso permite que o modelo de vídeo generativo realize operações como zoom, pan e inclinação, mantendo simultaneamente os movimentos das características do vídeo original.

Apesar do ReCapture representar um avanço significativo no processamento de vídeo amigável ao usuário, ele ainda está em fase de pesquisa e ainda há um longo caminho a percorrer até sua aplicação comercial. É importante notar que, embora o Google possua muitos projetos de IA de vídeo, nenhum deles foi lançado no mercado, sendo o projeto Veo possivelmente o mais próximo do uso comercial. Da mesma forma, o modelo Movie-Gen recentemente lançado pelo Meta e o Sora, lançado pela OpenAI no início do ano, também não foram comercializados. Atualmente, o mercado de IA de vídeo é liderado principalmente por startups como a Runway, que lançou seu mais recente modelo Gen-3Alpha no verão passado.

Recurso de IA para vídeos do Instagram em breve permitirá alterar facilmente a aparência e o fundo dos vídeos

O chefe do Instagram, Adam Mosseri, revelou em um vídeo recente um recurso de IA generativa que está chegando. Essas novas ferramentas permitirão aos usuários, por meio de prompts de texto, 'alterar praticamente qualquer aspecto de seus vídeos'. Essas ferramentas de edição de vídeo serão baseadas no modelo Movie Gen AI da Meta e devem ser lançadas oficialmente no próximo ano. Mosseri disse no vídeo: "Estamos desenvolvendo algumas coisas muito empolgantes para criadores de vídeo"

Plataforma de edição de vídeo indiana InVideo lança novo recurso de "texto para vídeo", com assinatura mensal próxima de mil reais

A plataforma de edição de vídeo InVideo lançou recentemente uma versão 3.0 significativamente atualizada, incluindo um recurso de geração de vídeo baseado em inteligência artificial. Os usuários podem simplesmente inserir prompts de texto para criar vídeos com cenas de ação ao vivo, animações ou estilo anime, e personalizar esses vídeos para plataformas como YouTube, Instagram Reels e LinkedIn. Embora este novo recurso dependa da construção de modelos de IA de terceiros, os usuários podem ajustar dinamicamente o vídeo adicionando prompts de texto.

Apple lança Final Cut Pro 11 com edição de vídeo com tecnologia de IA

A Apple lançou o Final Cut Pro 11, apresentando uma série de novos recursos, incluindo máscara magnética com tecnologia de IA e Transcrição para Legendas. O software estará disponível para download na quarta-feira. Usuários existentes receberão a atualização gratuitamente, enquanto novos usuários precisarão pagar US$ 300 para fazer o download. Os novos recursos do Final Cut Pro 11 incluem: Máscara Magnética: permite recortar facilmente pessoas e objetos de vídeos sem precisar de um fundo verde. Transcrição para Legendas:

Clapper: Ferramenta de edição de vídeo automatizada com IA que gera imagens, vídeos e áudios diretamente online

Clapper é uma ferramenta de edição de vídeo e geração de IA desenvolvida por um desenvolvedor independente, integrando diversas tecnologias de IA, como geração de imagens, vídeos e áudios. Oferece acesso a APIs para geração de imagens, áudios, músicas e vídeos, permitindo que os usuários completem todo o processo criativo, da concepção à edição final, em uma única plataforma. O Clapper possui uma linha do tempo, permitindo a geração e edição de conteúdo, e oferece dois modos: interface tradicional e tela infinita, atendendo às necessidades de brainstorming e edição precisa. Por ser uma ferramenta de código aberto, o Clapper...