Recentemente, a Microsoft lançou oficialmente em seu site um modelo básico de agente de IA multimodal chamado "Magma". Essa nova inteligência artificial possui a capacidade de transcender os mundos digital e físico, podendo processar simultaneamente vários tipos de dados, como imagens, vídeos e texto. Comparado aos assistentes de IA tradicionais, o Magma se destaca por sua capacidade de previsão psicológica, permitindo-lhe entender com maior precisão as intenções e comportamentos futuros de pessoas ou objetos em vídeos.

QQ_1740532404239.png

O Magma possui uma ampla gama de aplicações. Os usuários podem usar essa IA para fazer compras automaticamente, verificar o tempo e outras operações do dia a dia. Além disso, ele também pode controlar robôs físicos e fornecer assistência em tempo real em atividades como jogar xadrez. Essa capacidade multimodal permite que o Magma se destaque em diferentes ambientes e se adapte a tarefas complexas.

De acordo com a apresentação oficial, o Magma é especialmente adequado para assistentes ou robôs acionados por IA, ajudando-os a entender melhor o ambiente ao seu redor e a tomar as ações apropriadas. Por exemplo, ele pode orientar um robô doméstico a aprender como organizar itens nunca vistos antes ou ajudar um assistente virtual a gerar guias passo a passo para os usuários. Essa característica melhora significativamente a capacidade de aprendizado e a utilidade dos robôs.

O modelo Magma faz parte da série VLA (ação de linguagem visual), aprendendo com uma grande quantidade de dados visuais e linguísticos públicos, podendo integrar inteligência linguística, espacial e temporal, para lidar eficazmente com tarefas e desafios complexos da vida real. Com o desenvolvimento da tecnologia de inteligência artificial, o lançamento do Magma representa um grande avanço na tecnologia de assistentes inteligentes e robótica.

Link do projeto:https://microsoft.github.io/Magma/

Destaques:

🌐 **Capacidade Multimodal**: O Magma pode processar vários tipos de dados, como imagens, vídeos e texto, melhorando a funcionalidade dos assistentes inteligentes.

🤖 **Aplicações Inteligentes**: Os usuários podem usar o Magma para fazer pedidos automaticamente, verificar o tempo e controlar robôs físicos.

📚 **Capacidade de Aprendizagem e Adaptação**: O Magma ajuda os robôs a aprender novas tarefas e gera guias de operação para assistentes virtuais, aumentando sua utilidade.