A Tencent lançou recentemente um modelo de vídeo inovador chamado GameGen-O, o primeiro modelo de transformação de difusão do setor projetado especificamente para videogames de mundo aberto. Diferentemente dos modelos de vídeo tradicionais, o GameGen-O não apenas gera conteúdo de jogo de alta qualidade, mas também permite que os usuários controlem as ações dos personagens no vídeo em tempo real, como se estivessem controlando personagens de jogo, inaugurando uma nova era de interação entre inteligência artificial e jogos.
Vídeo de demonstração oficial
A principal vantagem do GameGen-O reside em sua capacidade diversificada de geração de conteúdo e controle interativo sem precedentes. Os usuários podem criar vários personagens, como "Geralt de Rívia" ou "Arthur Morgan", e colocá-los em ambientes com mudanças de estação, mostrando cenários diversificados como "passeio de motocicleta" ou "chuva". Mais emocionante ainda, o GameGen-O suporta geração de domínio aberto; os usuários podem, por meio de instruções estruturadas e sinais de operação, comandar o modelo em tempo real para gerar os trechos de vídeo correspondentes, como se estivessem dirigindo seu próprio mundo virtual.
Para alcançar essa tecnologia inovadora, a equipe da Tencent fez um grande esforço. Eles construíram o primeiro conjunto de dados de videogame de mundo aberto (OGameData), coletando dados de centenas de videogames de mundo aberto de última geração. Após uma seleção e processamento rigorosos, cerca de 15.000 vídeos de alta qualidade foram selecionados entre 32.000 vídeos originais. Esses vídeos passaram por vários processamentos, como detecção de cena, avaliação estética, análise de fluxo óptico e filtragem de conteúdo semântico. Finalmente, eles foram anotados de forma estruturada por modelos especialistas e modelos grandes multimodais, fornecendo uma base de dados refinada e interativa para o treinamento do modelo.
O processo de treinamento do GameGen-O também é único, dividido em duas etapas: pré-treinamento do modelo básico e ajuste fino de instruções. Na etapa de pré-treinamento, o modelo aprende a capacidade de geração de videogame de domínio aberto por meio de tarefas de texto para vídeo e continuação de vídeo. Na etapa de ajuste fino de instruções, a equipe de desenvolvimento congelou o modelo pré-treinado e introduziu o InstructNet treinável para ajuste fino, permitindo que o modelo gere quadros subsequentes com base em instruções estruturadas multimodais, realizando assim a geração de vídeo e o controle interativo com base em instruções.
Embora o GameGen-O ainda tenha espaço para melhorias em alguns aspectos, ele é, sem dúvida, um marco importante na criação de conteúdo de jogo impulsionado por IA. Essa tecnologia não apenas fornece ferramentas poderosas para desenvolvedores de jogos, mas também abre uma nova era para usuários comuns criarem e explorarem livremente o mundo virtual. Com o aprimoramento contínuo da tecnologia, podemos esperar que, em um futuro próximo, todos possam criar facilmente suas próprias experiências de jogo imersivas.
O surgimento do GameGen-O marca outra fusão profunda entre a indústria de jogos e o campo da inteligência artificial. Ele não apenas demonstra a força da Tencent em tecnologia de IA, mas também aponta a direção futura para todo o setor. Aguardamos ansiosamente para ver como essa tecnologia mudará o cenário da criação de jogos e trará mais surpresas e possibilidades para os jogadores.
Endereço do projeto: https://top.aibase.com/tool/gamegen-o