हाल ही में, शंघाई आर्टिफिशियल इंटेलिजेंस लैब (शंघाई AI लैब) ने पहला चित्र-शब्द मिश्रण निर्माण बड़ा मॉडल "बुकशेन·पु यु लिंग बी" (InternLM-XComposer) लॉन्च किया। पु यु लिंग बी प्रवाहपूर्ण चाइनीज और इंग्लिश चित्र-शब्द संवाद कर सकता है, चित्र सामग्री को सटीकता से समझ सकता है, और "एक-क्लिक जनरेशन" चित्र-शब्द मिश्रण लेखन क्षमता को अनलॉक करता है। उपयोगकर्ताओं को केवल एक विषय प्रदान करने की आवश्यकता होती है, और पु यु लिंग बी एक-क्लिक में चित्र और शब्दों से भरा लेख उत्पन्न कर सकता है। पु यु लिंग बी चित्र-शब्द लेखन के लिए "तीन चरणों" की एल्गोरिदम प्रक्रिया का पालन करता है, जिसमें पाठ उत्पन्न करना, चित्र योजना बनाना और चित्रों का स्मार्ट चयन करना शामिल है। कई प्रमुख मल्टी-मोडल मॉडल मूल्यांकन में, पु यु लिंग बी का प्रदर्शन हमेशा अग्रणी स्तर पर रहा है, विशेष रूप से चाइनीज मल्टी-मोडल समझ में यह बहुत उत्कृष्ट है। पु यु लिंग बी अब GitHub जैसे प्लेटफार्मों पर ओपन-सोर्स है, और डेवलपर्स को इसे आजमाने और नवाचार अनुप्रयोगों के लिए स्वागत किया जाता है।
शांघाई एआई प्रयोगशाला ने पहले ग्रंथ-चित्र मिश्रण निर्माण बड़े मॉडल "पु语 लिंग बी" को ओपन-सोर्स किया

上海人工智能实验室
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।