O Google anunciou recentemente a formação de uma nova equipe dedicada ao desenvolvimento de modelos de inteligência artificial (IA) capazes de simular o mundo físico. A equipe será liderada por Tim Brooks, que anteriormente atuou como co-líder do modelo de geração de vídeo Sora na OpenAI. Brooks anunciou na plataforma X que a nova equipe fará parte do laboratório de pesquisa de IA do Google, o Google DeepMind.
Em seu anúncio, Brooks mencionou: "Os planos da DeepMind são ambiciosos, com o objetivo de desenvolver modelos gerativos em larga escala para simular o mundo." Ele também afirmou que a equipe trabalhará em colaboração com as equipes do Gemini, Veo e Genie do Google para resolver "novos problemas cruciais" e expandir a escala dos modelos para o máximo de capacidade computacional. O Gemini é a série de modelos de IA principal do Google, usada principalmente para análise de imagens e geração de texto, enquanto o Veo é um modelo de geração de vídeo próprio do Google. Já o Genie é a tentativa do Google de criar um modelo mundial, capaz de simular jogos e ambientes 3D em tempo real.
Segundo Brooks, a equipe desenvolverá ferramentas de "geração interativa em tempo real" e pesquisará como integrar seus modelos com modelos multimodais existentes, como o Gemini. A descrição do trabalho menciona: "Acreditamos que a escalabilidade do treinamento de IA baseado em vídeo e dados multimodais é um caminho crucial para alcançar a inteligência artificial geral (IAG)." IAG se refere a uma inteligência artificial capaz de realizar qualquer tarefa que um humano possa realizar.
Muitas startups e grandes empresas de tecnologia também estão buscando o desenvolvimento de modelos mundiais, como o World Labs, liderado pela renomada pesquisadora de IA Fei-Fei Lee, a startup israelense Decart e a Odyssey. Essas empresas acreditam que, no futuro, os modelos mundiais poderão ser usados para criar mídia interativa, como videogames e filmes, e para executar simulações reais, como o treinamento de robôs.
No entanto, o setor criativo tem opiniões divergentes sobre essa tecnologia. Uma pesquisa recente da revista Wired mostrou que empresas de desenvolvimento de jogos, como a Activision Blizzard, estão utilizando IA para reduzir custos e aumentar a produtividade, mas isso também levou à demissão em massa de funcionários. De acordo com um estudo do sindicato de animadores de 2024, estima-se que mais de 100.000 empregos na indústria americana de cinema, televisão e animação serão afetados pela IA até 2026.
Apesar disso, algumas startups emergentes de modelagem mundial, como a Odyssey, prometem colaborar com profissionais criativos, em vez de substituí-los. Resta saber se essa será a abordagem do Google. Além disso, a questão dos direitos autorais ainda não foi resolvida. O treinamento de alguns modelos mundiais pode ter usado clipes de jogos de vídeo sem autorização, expondo as empresas envolvidas a riscos de processos judiciais.
O Google afirma que o treinamento de modelos no YouTube foi feito com base em permissões obtidas de acordo com os termos de serviço da plataforma, mas ainda não revelou quais vídeos foram usados especificamente.