Em 26 de fevereiro, a equipe do Google DeepMind lançou o Genie, um modelo mundial básico, um ambiente virtual interativo gerado com 11 bilhões de parâmetros. Treinado com dados de vídeo, ele gera fotos, esboços e até mesmo mundos virtuais controláveis. O Genie foi treinado sem quaisquer rótulos de ação, ao contrário dos AIs tradicionais que necessitam de rotulagem manual de imagens para o treinamento de reconhecimento de imagens. Isso significa que o Genie precisa identificar sozinho as características e padrões de diferentes ações a partir dos vídeos. Os vídeos gerados pelo Genie são estilizados como desenhos animados, podendo simular movimentos de robôs e objetos deformáveis, sendo mais voltado para animações curtas do que o Sora. O Google afirma que o Genie apresenta desafios significativos, sendo capaz de aprender controle de detalhes finos a partir de vídeos da internet. O Genie também consegue simular várias ações potenciais e inferir diferentes ações com base no ambiente gerado.
Google lança o modelo mundial básico Genie, com 11 bilhões de parâmetros

雪球App
143
© Todos os direitos reservados AIbase Base 2024, clique para ver a fonte - https://www.aibase.com/pt/news/5657