昆仑万维发布Matrix-Zero世界模型:中国首个同时具备3D场景和交互式视频生成的模型

Em 14 de fevereiro de 2025, o Grupo Kunlun Wanwei lançou oficialmente o modelo mundial Matrix-Zero, marcando um passo importante para a China na área de inteligência espacial. O Matrix-Zero inclui dois submodelos: um modelo de linguagem grande para geração de cenas 3D e um modelo de linguagem grande para geração de vídeos interativos, com o objetivo de remodelar os métodos de criação de conteúdo digital por meio da IA e impulsionar a inovação em setores como produção cinematográfica, desenvolvimento de jogos e inteligência incorporada.
Fei-Fei Li, professora da Universidade de Stanford e considerada a 'Mãe da IA', e sua equipe publicaram recentemente uma pesquisa sobre a 'inteligência espacial' de modelos multimodais de larga escala, revelando que esses modelos já possuem capacidades iniciais de memória e evocação espacial, e demonstram potencial para formar modelos de mundo locais. A equipe de pesquisa desenvolveu uma ferramenta para avaliar a capacidade de inteligência espacial visual — VSI-Bench —, contendo mais de 5.000 pares de perguntas e respostas de alta qualidade baseados em 288 vídeos reais. Os vídeos de teste abrangem espaços residenciais, ambientes profissionais e cenários industriais, envolvendo múltiplas localizações geográficas.