इन दिनों, ChatGPT ने अपनी इमेज जेनरेट करने की क्षमता के कारण उपयोगकर्ताओं की संख्या में भारी वृद्धि देखी है, जिससे भुगतान करने वाले उपयोगकर्ताओं की संख्या में 20 मिलियन की वृद्धि हुई है। ऐसा लगता है कि ओपेनएआई के लोग खुशी से झूम रहे होंगे।

इन दिनों लोगों द्वारा शेयर किए गए विभिन्न तरीकों से हमें ChatGPT4O की जेनरेट करने की क्षमता के प्रति सम्मान और आश्चर्य हुआ है। इससे पहले जहाँ चीनी भाषा में लिखने में यह थोड़ा कमज़ोर था, अब वह भी ठीक हो गया है। और अब, ChatGPT ने "Creat image" फ़ंक्शन को अपडेट किया है। कुछ दिन पहले तक यह केवल साधारण फ़ॉन्ट जेनरेट करता था, लेकिन अब यह कर्सिव स्क्रिप्ट भी जेनरेट कर सकता है, और वह भी बहुत सटीकता के साथ।

image.png

कुछ दिन पहले के संस्करण की तुलना में, नए संस्करण के मॉडल में विस्तृत रेंडरिंग, रंगों का समन्वय और जटिल निर्देशों को समझने में स्पष्ट सुधार हुआ है।

उदाहरण के लिए, उपयोगकर्ता द्वारा वर्णनात्मक पाठ इनपुट करने पर, सिस्टम अधिक स्पष्ट, प्राकृतिक और अपेक्षा के अनुरूप छवि उत्पन्न कर सकता है। चाहे वह यथार्थवादी चित्र हो या अमूर्त कला शैली, यह उच्च स्तर की पूर्णता प्रदर्शित करता है। इस तेज़ी से होने वाले बदलाव की क्षमता ओपेनएआई के एल्गोरिथम ऑप्टिमाइज़ेशन और मॉडल प्रशिक्षण में गहरे अनुभव को दर्शाती है, और यह उपयोगकर्ता की आवश्यकताओं के प्रति इसकी तीव्र प्रतिक्रिया को भी दर्शाती है।

नीचे AIBASE के ब्लॉगर hahagood द्वारा साझा किए गए प्रॉम्प्ट टेस्ट के परिणाम दिए गए हैं:

image.png

प्रॉम्प्ट: Create a hand-drawn infographic-style card in a 9:16 aspect ratio, featuring a bold title and text in Chinese using 草书 (cursive script). The background should be textured beige or off-white, with the title prominently displayed in large, contrasting red and black brushstroke-style characters. Use simple, eye-catching hand-drawn illustrations or icons that complement the theme. For the content, organize it into 2–4 sections, with short, concise Chinese phrases in 草书, each illustrating a key point. The text should be legible but retain the flow and artistic nature of cursive writing. Add relevant visual elements (e.g., simple drawings of people, question marks, or symbols) to make the card visually engaging and thought-provoking. Ensure the overall composition is balanced, with enough space to make the content feel uncluttered and easy to digest.

बहुत ही शानदार, अक्षरों के स्ट्रोक पूरे हैं, और फ़ॉन्ट आउटपुट भी सही है।

लेकिन मैंने बाद में कठिनाई बढ़ा दी, और मैंने लीशू और जुआनशू का परीक्षण किया, यह उन्हें भी उत्पन्न कर सकता है, लेकिन कुछ त्रुटियां हैं। कुछ सामान्य रूप से उपयोग किए जाने वाले कैलीग्राफी शैलियों के लिए यह कोई समस्या नहीं है, लेकिन जुआनशू ChatGPT के लिए अभी भी थोड़ा कठिन है।

image.png

लीशू

image.png

जुआनशू

ध्यान देने योग्य बात यह है कि नए संस्करण में एक चयन उपकरण भी शामिल किया गया है, जिससे उपयोगकर्ता पाठ वर्णन के माध्यम से छवि के विशिष्ट क्षेत्रों को समायोजित कर सकते हैं, जैसे कि पृष्ठभूमि रंग समायोजित करना या विवरण तत्व जोड़ना। इस तरह की सटीक संपादन क्षमता रचनाकारों को अधिक लचीलापन प्रदान करती है।