VideoWorld
VideoWorld é um modelo generativo profundo que explora o aprendizado de conhecimento a partir de vídeos sem rótulos.
Produto ComumVídeoInteligência ArtificialVisão Computacional
VideoWorld é um modelo generativo profundo focado no aprendizado de conhecimento complexo a partir de entrada puramente visual (vídeos sem rótulos). Através da técnica de geração de vídeo autorregressiva, ele explora como aprender regras de tarefas, raciocínio e capacidade de planejamento apenas com informações visuais. A principal vantagem do modelo reside em seu inovador Modelo Dinâmico Latente (MDL), capaz de representar eficientemente mudanças visuais em múltiplas etapas, melhorando significativamente a eficiência do aprendizado e a aquisição de conhecimento. O VideoWorld apresentou excelente desempenho em tarefas de Go em vídeo e controle de robôs, demonstrando sua poderosa capacidade de generalização e sua habilidade de aprender tarefas complexas. O contexto da pesquisa se origina na imitação de como organismos vivos aprendem conhecimento através da visão, e não da linguagem, buscando abrir novas vias para a aquisição de conhecimento em inteligência artificial.
VideoWorld Situação do Tráfego Mais Recente
Total de Visitas Mensais
2314
Taxa de Rejeição
67.91%
Média de Páginas por Visita
1.4
Duração Média da Visita
00:00:44