moondream
Un potente modelo de lenguaje visual pequeño y versátil.
Producto ComúnImagenVisiónModelo de lenguaje
moondream es un modelo de 1.6 mil millones de parámetros construido utilizando los conjuntos de datos de entrenamiento SigLIP, Phi-1.5 y LLaVA. Debido al uso del conjunto de datos LLaVA, los pesos están protegidos por la licencia CC-BY-SA. Puedes probarlo en Huggingface Spaces. El rendimiento del modelo en los benchmarks VQAv2, GQA, VizWiz y TextVQA es el siguiente: LLaVA-1.5 (13.3B parámetros): 80.0, 63.3, 53.6, 61.3; LLaVA-1.5 (7.3B parámetros): 78.5, 62.0, 50.0, 58.2; MC-LLaVA-3B (3B parámetros): 64.2, 49.6, 24.9, 38.6; LLaVA-Phi (3B parámetros): 71.4, -, 35.9, 48.6; moondream1 (1.6B parámetros): 74.3, 56.3, 30.3, 39.8.
moondream Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34