Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Tencent lança GeometryCrafter: usando IA para desbloquear a beleza da consistência geométrica em vídeos de mundos abertos

AIbase基地

Publicado emNotícias e Informações de IA · 7 minutos de leitura · Apr 2, 2025

Recentemente, a Tencent marcou mais um ponto na área da inteligência artificial, com sua equipe de pesquisa lançando oficialmente o novo modelo de IA GeometryCrafter através da plataforma Hugging Face. Este modelo, com sua capacidade excepcional de estimar a geometria de forma consistente em vídeos de mundo aberto, rapidamente se tornou o foco da atenção no setor de tecnologia. Com o auxílio da tecnologia de prioridade de difusão (Diffusion Priors), o GeometryCrafter não apenas traz novas possibilidades para a compreensão e processamento profundo de conteúdo de vídeo, mas também oferece aos criadores e pesquisadores uma "chave" para explorar o mundo tridimensional.

O principal destaque do GeometryCrafter é sua capacidade de extrair e gerar informações geométricas consistentes a partir de vídeos dinâmicos e complexos de mundo aberto. Os chamados "vídeos de mundo aberto" são aqueles com conteúdo diversificado, mudanças frequentes de cenário e perspectivas variadas, como filmagens de rua, registros de viagens ou documentários de paisagens naturais. Diferentemente da estimativa geométrica de imagens estáticas tradicionais, esses vídeos exigem maior consistência espaço-temporal e capacidade de generalização do modelo de IA. A equipe da Tencent, combinando modelos de difusão pré-treinados com a estimativa geométrica de vídeo, conseguiu fazer com que o GeometryCrafter gerasse sequências de profundidade e estruturas geométricas detalhadas e contínuas, sem informações adicionais (como pose da câmera ou dados de fluxo óptico).

Segundo informações, a inspiração para o desenvolvimento do modelo veio do sucesso dos modelos de difusão na geração de imagens. A tecnologia de prioridade de difusão, através de um processo gradual de remoção de ruído, consegue capturar as sutis relações entre os quadros de vídeo e transformar essas informações em representações geométricas do espaço tridimensional. Seja a dinâmica do fluxo constante de pedestres em ruas da cidade ou as paisagens naturais com jogos de luz e sombra em montanhas e rios, o GeometryCrafter consegue reproduzir suas camadas espaciais com precisão impressionante. Essa capacidade não apenas faz com que o conteúdo de vídeo "salte" do plano bidimensional para o tridimensional, mas também estabelece uma base sólida para aplicações posteriores, como efeitos visuais e geração de conteúdo de realidade virtual.

Especialistas do setor apontam que o lançamento do GeometryCrafter preenche uma lacuna no campo da estimativa geométrica de vídeos de mundo aberto. Anteriormente, muitos modelos, ao lidar com vídeos longos ou cenários não controlados, frequentemente apresentavam resultados distorcidos devido à falta de compreensão de contexto suficiente. O GeometryCrafter, por meio de sua estratégia de treinamento em três etapas, combinando conjuntos de dados reais e sintéticos, preserva a riqueza e diversidade do conteúdo, garantindo ao mesmo tempo a precisão dos detalhes geométricos. Os resultados experimentais mostram que o modelo superou os métodos existentes em vários conjuntos de dados públicos, especialmente na manutenção da consistência de sequências longas, tornando-se um marco no setor.

Para usuários comuns e criadores, o significado do GeometryCrafter também é profundo. Imagine: cenas de crianças correndo em gravações caseiras podem receber profundidade tridimensional com essa tecnologia, e até mesmo serem integradas perfeitamente a cenários virtuais; ou um cineasta independente usando o GeometryCrafter para transformar material de filmagem simples em uma experiência visual imersiva. A decisão da Tencent de disponibilizar o código e os pesos do modelo no Hugging Face também reflete sua determinação em promover a democratização da tecnologia de IA, permitindo que mais pessoas participem da exploração e aplicação dessa tecnologia.

Claro, o GeometryCrafter não é perfeito. Alguns analistas mencionam que sua demanda por recursos computacionais pode ser um desafio para dispositivos comuns, e que o desempenho do modelo ainda pode ser otimizado em cenários extremamente complexos (como multidões densas ou objetos em movimento rápido). Mas é inegável que o lançamento dessa tecnologia nos abriu uma janela, permitindo-nos vislumbrar como a IA pode transformar fragmentos da vida cotidiana em arte digital repleta de tridimensionalidade.

Com o lançamento do GeometryCrafter, a Tencent demonstra mais uma vez seu profundo acúmulo e capacidade de inovação na área de IA. Da reconstrução geométrica de conteúdo de vídeo às aplicações interdisciplinares potenciais, este modelo não é apenas um avanço tecnológico, mas um convite caloroso — um convite para cada pessoa usar o poder da tecnologia para redescobrir e moldar o mundo colorido em que vivemos.

Artigo científico:https://huggingface.co/papers/2504.01016

Modelo:https://huggingface.co/TencentARC/GeometryCrafter

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily