浙江大学竺院 के एक पूर्व छात्र ने माइक्रोसॉफ्ट रिसर्च इंस्टीट्यूट के साथ मिलकर मल्टी-मोडल मॉडल LLaVA लॉन्च किया, जो GPT-4V को चुनौती देता है। LLaVA ने 11 परीक्षण डेटा सेटों पर उत्कृष्ट प्रदर्शन किया, और 6k+ स्टार मार्क प्राप्त किए। मॉडल की समग्र क्षमता उच्च है, जो GPT-4V स्तर के 85% से अधिक है। LLaVA का ओपन-सोर्स कोड, मॉडल और प्रशिक्षण डेटा अब उपलब्ध है।
Zhejiang University Alumni Collaborate with Microsoft to Launch Multimodal Model LLaVA, Challenging GPT-4V
