MM1.5

Optimización y análisis de modelos de lenguaje grandes multimodales

Producto ComúnProductividadMultimodalModelo de lenguaje grande
MM1.5 es una serie de modelos de lenguaje grandes multimodales (MLLM) diseñados para mejorar la comprensión de imágenes enriquecidas con texto, la referencia visual y la conexión a tierra, y el razonamiento multiimagen. El modelo se basa en la arquitectura MM1 y emplea un método de entrenamiento de modelos centrado en los datos, explorando sistemáticamente el impacto de diferentes mezclas de datos durante todo el ciclo de vida del entrenamiento del modelo. Los modelos MM1.5 varían de 1B a 30B parámetros, incluyendo variantes densas y de expertos mixtos (MoE), y a través de extensos estudios empíricos y de ablación, proporcionan información detallada sobre el proceso de entrenamiento y las decisiones tomadas, ofreciendo una valiosa guía para futuras investigaciones en el desarrollo de MLLM.
Abrir sitio web

MM1.5 Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

MM1.5 Tendencia de visitas

MM1.5 Distribución geográfica de las visitas

MM1.5 Fuentes de tráfico

MM1.5 Alternativas