मूनड्रीम
एक शक्तिशाली छोटा दृश्य भाषा मॉडल, हर जगह मौजूद है
सामान्य उत्पादछविदृश्यभाषा मॉडल
मूनड्रीम एक 1.6 बिलियन पैरामीटर मॉडल है जो SigLIP, Phi-1.5 और LLaVA प्रशिक्षण डेटासेट का उपयोग करके बनाया गया है। LLaVA डेटासेट के उपयोग के कारण, वज़न CC-BY-SA लाइसेंस के अंतर्गत सुरक्षित हैं। आप इसे Huggingface Spaces पर आज़मा सकते हैं। यह मॉडल VQAv2, GQA, VizWiz और TextVQA बेंचमार्क में इस प्रकार प्रदर्शन करता है: LLaVA-1.5 (13.3B पैरामीटर): 80.0, 63.3, 53.6, 61.3; LLaVA-1.5 (7.3B पैरामीटर): 78.5, 62.0, 50.0, 58.2; MC-LLaVA-3B (3B पैरामीटर): 64.2, 49.6, 24.9, 38.6; LLaVA-Phi (3B पैरामीटर): 71.4, -, 35.9, 48.6; moondream1 (1.6B पैरामीटर): 74.3, 56.3, 30.3, 39.8।
मूनड्रीम नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
474564576
बाउंस दर
36.20%
प्रति विज़िट औसत पृष्ठ
6.1
औसत विज़िट अवधि
00:06:34