llava-llama-3-8b-v1_1
Modelo LLaVA optimizado por XTuner, que combina el procesamiento de imágenes y texto.
Nuevo Producto PremiumProgramaciónInteligencia ArtificialAprendizaje Multimodal
llava-llama-3-8b-v1_1 es un modelo LLaVA optimizado por XTuner, basado en meta-llama/Meta-Llama-3-8B-Instruct y CLIP-ViT-Large-patch14-336, y afinado con ShareGPT4V-PT e InternVL-SFT. Está diseñado específicamente para el procesamiento combinado de imágenes y texto, posee una potente capacidad de aprendizaje multimodal y es adecuado para diversos kits de herramientas de implementación y evaluación.
llava-llama-3-8b-v1_1 Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44