llava-llama-3-8b-v1_1

Modelo LLaVA otimizado pelo XTuner, combinando processamento de imagem e texto.

Novo Produto PremiumProgramaçãoInteligência ArtificialAprendizado Multimodal
llava-llama-3-8b-v1_1 é um modelo LLaVA otimizado pelo XTuner, baseado em meta-llama/Meta-Llama-3-8B-Instruct e CLIP-ViT-Large-patch14-336, e ajustado finamente por meio do ShareGPT4V-PT e InternVL-SFT. Este modelo foi projetado especificamente para o processamento combinado de imagem e texto, possuindo poderosa capacidade de aprendizado multimodal, adequado para diversos kits de ferramentas de implantação e avaliação.
Abrir Site

llava-llama-3-8b-v1_1 Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

llava-llama-3-8b-v1_1 Tendência de Visitas

llava-llama-3-8b-v1_1 Distribuição Geográfica das Visitas

llava-llama-3-8b-v1_1 Fontes de Tráfego

llava-llama-3-8b-v1_1 Alternativas