moondream

Um poderoso modelo de linguagem visual compacto e versátil.

Produto ComumImagemVisãoModelo de Linguagem
O moondream é um modelo de 1,6 bilhão de parâmetros construído usando os conjuntos de dados de treinamento SigLIP, Phi-1.5 e LLaVA. Devido ao uso do conjunto de dados LLaVA, os pesos estão protegidos pela licença CC-BY-SA. Você pode experimentá-lo no Huggingface Spaces. O desempenho do modelo nos benchmarks VQAv2, GQA, VizWiz e TextVQA é o seguinte: LLaVA-1.5 (13,3B parâmetros): 80,0; 63,3; 53,6; 61,3; LLaVA-1.5 (7,3B parâmetros): 78,5; 62,0; 50,0; 58,2; MC-LLaVA-3B (3B parâmetros): 64,2; 49,6; 24,9; 38,6; LLaVA-Phi (3B parâmetros): 71,4; -; 35,9; 48,6; moondream1 (1,6B parâmetros): 74,3; 56,3; 30,3; 39,8.
Abrir Site

moondream Situação do Tráfego Mais Recente

Total de Visitas Mensais

474564576

Taxa de Rejeição

36.20%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:34

moondream Tendência de Visitas

moondream Distribuição Geográfica das Visitas

moondream Fontes de Tráfego

moondream Alternativas