llava-llama-3-8b-v1_1
Modelo LLaVA otimizado pelo XTuner, combinando processamento de imagem e texto.
Novo Produto PremiumProgramaçãoInteligência ArtificialAprendizado Multimodal
llava-llama-3-8b-v1_1 é um modelo LLaVA otimizado pelo XTuner, baseado em meta-llama/Meta-Llama-3-8B-Instruct e CLIP-ViT-Large-patch14-336, e ajustado finamente por meio do ShareGPT4V-PT e InternVL-SFT. Este modelo foi projetado especificamente para o processamento combinado de imagem e texto, possuindo poderosa capacidade de aprendizado multimodal, adequado para diversos kits de ferramentas de implantação e avaliação.
llava-llama-3-8b-v1_1 Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44