हाल ही में, OpenAI ने एक दिलचस्प समाचार जारी किया: इसके आंतरिक परीक्षण परियोजना Sora में, पहले से उपलब्ध वीडियो निर्माण सुविधा के अलावा, चित्र निर्माण सुविधा भी तेजी से विकसित की जा रही है। यह नई सुविधा उपयोगकर्ताओं को वीडियो और चित्र निर्माण के बीच तेजी से स्विच करने की अनुमति देती है, जिससे रचनात्मकता में लचीलापन बढ़ता है।
आंतरिक जानकारी के अनुसार, Sora एक छिपा हुआ स्विच बटन जोड़ेगा, जिससे उपयोगकर्ता केवल संकेत बार में चयन करके दोनों मोड के बीच स्विच कर सकेंगे। जब चित्र निर्माण का चयन किया जाता है, तो सिस्टम उपयोगकर्ताओं को एक चित्र का वर्णन करने के लिए स्वचालित रूप से प्रेरित करेगा। इस डिज़ाइन का उद्देश्य उपयोगकर्ता के संचालन को सरल बनाना और उत्पन्न सामग्री की प्रासंगिकता और गुणवत्ता को बढ़ाना है।
चित्र निर्माण सुविधा में सुधार के अलावा, Sora ने अपने वीडियो推送 को फिर से वर्गीकृत किया है। नए लॉन्च किए गए “Best” और “Top” श्रेणियाँ उपयोगकर्ताओं को सामग्री को बेहतर तरीके से छानने और खोजने में मदद करेंगी। “Best” श्रेणी वर्तमान की विशेष चैनलों के समान है, जबकि “Top” श्रेणी संभवतः उपयोगकर्ता के लाइक संख्या या समय अवधि के आधार पर वीडियो को रैंक करेगी। इस वर्गीकरण में बदलाव ने Sora की सामग्री सिफारिश तंत्र के प्रति लोगों की अपेक्षाओं को बढ़ा दिया है।
DALL-E3 के उपयोगकर्ताओं के लिए, यह समाचार निश्चित रूप से रोमांचक है, क्योंकि DALL-E3 की घोषणा के बाद से यह कुछ पुराना लगने लगा है, विशेषकर Midjourney जैसे प्रतिस्पर्धियों की तुलना में। हालाँकि वर्तमान में Sora की चित्र निर्माण सुविधा अभी आधिकारिक रूप से लॉन्च नहीं हुई है, लेकिन बाएँ नेविगेशन बार में “Images Internal” श्रेणी ने उपयोगकर्ताओं की जिज्ञासा को जगाया है। हालाँकि वर्तमान में यह श्रेणी मुख्य रूप से वीडियो推送 के लिए है, लेकिन भविष्य में चित्र निर्माण से संबंधित सामग्री भी प्रदान की जा सकती है।
कुछ लोग अनुमान लगा रहे हैं कि इस चित्र निर्माण मॉडल को DALL-E4 कहा जा सकता है, हालाँकि OpenAI ने अभी तक इसकी पुष्टि नहीं की है। उद्योग विशेषज्ञों का अनुमान है कि Sora में चित्र निर्माणकर्ता संभवतः सीधे DALL-E4 का उपयोग नहीं करेंगे, बल्कि मौजूदा “sora-turbo” मॉडल पर निर्भर करेंगे। इसके अलावा, उद्योग के लोगों ने यह भी बताया कि ChatGPT ने अभी तक GPT-4o पर आधारित बहु-मोडल चित्र निर्माण सुविधा लॉन्च नहीं की है, इसलिए इस बार Sora परियोजना का लॉन्च एक महत्वपूर्ण नई प्रगति है।
यह ध्यान देने योग्य है कि Sora में टेक्स्ट से चित्र निर्माणकर्ता का कोड नाम “papaya” है, जिससे इस परियोजना के प्रति जिज्ञासा और अपेक्षा बढ़ती है। DALL-E3 के एक साल और छह महीने बाद, अगली पीढ़ी का मॉडल वास्तव में क्या नवाचार लाएगा, यह जानने की उत्सुकता जगाता है।