हाल ही में, शंघाई आर्टिफिशियल इंटेलिजेंस लैब (शंघाई AI लैब) ने पहला चित्र-शब्द मिश्रण निर्माण बड़ा मॉडल "बुकशेन·पु यु लिंग बी" (InternLM-XComposer) लॉन्च किया। पु यु लिंग बी प्रवाहपूर्ण चाइनीज और इंग्लिश चित्र-शब्द संवाद कर सकता है, चित्र सामग्री को सटीकता से समझ सकता है, और "एक-क्लिक जनरेशन" चित्र-शब्द मिश्रण लेखन क्षमता को अनलॉक करता है। उपयोगकर्ताओं को केवल एक विषय प्रदान करने की आवश्यकता होती है, और पु यु लिंग बी एक-क्लिक में चित्र और शब्दों से भरा लेख उत्पन्न कर सकता है। पु यु लिंग बी चित्र-शब्द लेखन के लिए "तीन चरणों" की एल्गोरिदम प्रक्रिया का पालन करता है, जिसमें पाठ उत्पन्न करना, चित्र योजना बनाना और चित्रों का स्मार्ट चयन करना शामिल है। कई प्रमुख मल्टी-मोडल मॉडल मूल्यांकन में, पु यु लिंग बी का प्रदर्शन हमेशा अग्रणी स्तर पर रहा है, विशेष रूप से चाइनीज मल्टी-मोडल समझ में यह बहुत उत्कृष्ट है। पु यु लिंग बी अब GitHub जैसे प्लेटफार्मों पर ओपन-सोर्स है, और डेवलपर्स को इसे आजमाने और नवाचार अनुप्रयोगों के लिए स्वागत किया जाता है।