moondream
Um poderoso modelo de linguagem visual compacto e versátil.
Produto ComumImagemVisãoModelo de Linguagem
O moondream é um modelo de 1,6 bilhão de parâmetros construído usando os conjuntos de dados de treinamento SigLIP, Phi-1.5 e LLaVA. Devido ao uso do conjunto de dados LLaVA, os pesos estão protegidos pela licença CC-BY-SA. Você pode experimentá-lo no Huggingface Spaces. O desempenho do modelo nos benchmarks VQAv2, GQA, VizWiz e TextVQA é o seguinte: LLaVA-1.5 (13,3B parâmetros): 80,0; 63,3; 53,6; 61,3; LLaVA-1.5 (7,3B parâmetros): 78,5; 62,0; 50,0; 58,2; MC-LLaVA-3B (3B parâmetros): 64,2; 49,6; 24,9; 38,6; LLaVA-Phi (3B parâmetros): 71,4; -; 35,9; 48,6; moondream1 (1,6B parâmetros): 74,3; 56,3; 30,3; 39,8.
moondream Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34