चाइनीज टीम द्वारा विकसित MiniGPT-v2 दृश्य मॉडल ने GitHub पर 20,000 से अधिक सितारे प्राप्त किए हैं, जो कई दृश्य कार्यों को पूरा कर सकता है, जिसमें लक्ष्य वस्तु का वर्णन, दृश्य स्थिति निर्धारण और चित्र विवरण शामिल हैं। MiniGPT-v2 ने बहु-चरण प्रशिक्षण का उपयोग किया है, दृश्य प्रश्न उत्तर और ग्राउंड बेंचमार्क परीक्षण में उत्कृष्ट प्रदर्शन करते हुए, ViT दृश्य आधार पर आधारित है, और सरल मल्टी-मोडल निर्देशों के माध्यम से कुशलता से कार्यों को पूरा करता है।
MiniGPT-v2 ने दृश्य क्षमताओं में बड़े पैमाने पर सुधार किया, GitHub परियोजना को 20,000 सितारों की प्राप्ति

量子位
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।