LLaVA-3b
LLaVA-3b é um modelo ajustado com base no Dolphin 2.6 Phi, utilizando a torre visual SigLIP 400M com ajuste fino no estilo LLaVA. O modelo possui múltiplas marcações de imagem e utiliza a saída da camada mais recente do codificador visual, entre outras características.
LLaVA-3b Situação do Tráfego Mais Recente
Total de Visitas Mensais
27175375
Taxa de Rejeição
44.30%
Média de Páginas por Visita
5.8
Duração Média da Visita
00:04:57