浙江大学竺院 के एक पूर्व छात्र ने माइक्रोसॉफ्ट रिसर्च इंस्टीट्यूट के साथ मिलकर मल्टी-मोडल मॉडल LLaVA लॉन्च किया, जो GPT-4V को चुनौती देता है। LLaVA ने 11 परीक्षण डेटा सेटों पर उत्कृष्ट प्रदर्शन किया, और 6k+ स्टार मार्क प्राप्त किए। मॉडल की समग्र क्षमता उच्च है, जो GPT-4V स्तर के 85% से अधिक है। LLaVA का ओपन-सोर्स कोड, मॉडल और प्रशिक्षण डेटा अब उपलब्ध है।
Zhejiang University Alumni Collaborate with Microsoft to Launch Multimodal Model LLaVA, Challenging GPT-4V

量子位
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।