llava-llama-3-8b-v1_1

Modelo LLaVA optimizado por XTuner, que combina el procesamiento de imágenes y texto.

Nuevo Producto PremiumProgramaciónInteligencia ArtificialAprendizaje Multimodal
llava-llama-3-8b-v1_1 es un modelo LLaVA optimizado por XTuner, basado en meta-llama/Meta-Llama-3-8B-Instruct y CLIP-ViT-Large-patch14-336, y afinado con ShareGPT4V-PT e InternVL-SFT. Está diseñado específicamente para el procesamiento combinado de imágenes y texto, posee una potente capacidad de aprendizaje multimodal y es adecuado para diversos kits de herramientas de implementación y evaluación.
Abrir sitio web

llava-llama-3-8b-v1_1 Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

llava-llama-3-8b-v1_1 Tendencia de visitas

llava-llama-3-8b-v1_1 Distribución geográfica de las visitas

llava-llama-3-8b-v1_1 Fuentes de tráfico

llava-llama-3-8b-v1_1 Alternativas