Magma-8B
Magma-8B es un modelo de IA multimodal desarrollado por Microsoft que puede procesar entradas de imagen y texto y generar salidas de texto.
Producto ComúnImagenMultimodalIA
Magma-8B es un modelo base de IA multimodal desarrollado por Microsoft, diseñado para la investigación de agentes de IA multimodales. Combina entradas de texto e imagen para generar salidas de texto, y posee capacidades de planificación visual y actuación. El modelo utiliza Meta LLaMA-3 como base del modelo de lenguaje y el codificador visual CLIP-ConvNeXt-XXLarge, pudiendo aprender relaciones espacio-temporales a partir de datos de vídeo sin etiquetar. Posee una potente capacidad de generalización y adaptabilidad multitarea. Magma-8B destaca en tareas multimodales, especialmente en la comprensión e inferencia espacial. Ofrece una potente herramienta para la investigación de IA multimodal, impulsando la investigación de interacciones complejas en entornos virtuales y reales.
Magma-8B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44