Magma-8B
Magma-8B é um modelo de IA multimodal lançado pela Microsoft, capaz de processar entradas de imagem e texto e gerar saídas de texto.
Produto ComumImagemMultimodalIA
Magma-8B é um modelo de base de IA multimodal desenvolvido pela Microsoft, projetado para pesquisa de agentes de IA multimodais. Combinando entradas de texto e imagem, ele pode gerar saídas de texto e possui capacidades de planejamento visual e de agente. O modelo utiliza o Meta LLaMA-3 como espinha dorsal do modelo de linguagem e combina o codificador visual CLIP-ConvNeXt-XXLarge, suportando o aprendizado de relações espaço-temporais a partir de dados de vídeo não rotulados, possuindo forte capacidade de generalização e adaptabilidade multitarefa. O Magma-8B se destaca em tarefas multimodais, especialmente em compreensão e raciocínio espacial. Ele fornece uma ferramenta poderosa para pesquisa de IA multimodal, impulsionando a pesquisa de interações complexas em ambientes virtuais e reais.
Magma-8B Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44