OpenAI ने हाल ही में वीडियो AI क्षेत्र में फिर से हलचल मचाई है, वे इस साल फरवरी में जारी किए गए Sora में बड़े सुधार कर रहे हैं। "इनफॉर्मेशन डेली" की रिपोर्ट के अनुसार, इस सुधार का मुख्य लक्ष्य Sora के प्रदर्शन को काफी बढ़ाना है, ताकि यह तेजी से लंबे और उच्च गुणवत्ता वाले वीडियो सामग्री उत्पन्न कर सके।
Sora के पहले संस्करण के प्रदर्शन पर नजर डालें, तो वास्तव में कई समस्याएं थीं जिन्हें हल करने की आवश्यकता थी। प्रारंभिक संस्करण को एक वीडियो उत्पन्न करने में 10 मिनट से अधिक समय लगता था, इस तरह की दक्षता स्पष्ट रूप से वास्तविक उपयोग की आवश्यकताओं को पूरा नहीं कर सकती। और अधिक गंभीर बात यह है कि कई फिल्म निर्माताओं ने Sora की आउटपुट गुणवत्ता पर काफी आपत्ति जताई है।
निर्माता पैट्रिक सेडरबर्ग का अनुभव एक典型案例 है: एक उपयोगी वीडियो प्राप्त करने के लिए, उन्हें सैकड़ों क्लिप उत्पन्न करने पड़े। Sora शैली, वस्तुओं और पात्रों की निरंतरता बनाए रखने में अच्छा प्रदर्शन नहीं कर पाया, भौतिक गलतियाँ बार-बार होती रहीं, ये समस्याएँ इसकी उपयोगिता को गंभीर रूप से प्रभावित करती हैं।
चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता Midjourney
हालांकि, ये चुनौतियाँ वीडियो AI क्षेत्र में असामान्य नहीं हैं। नए संस्करण Sora का विकास इन समस्याओं के समाधान के लिए किया गया है। प्रणाली के प्रदर्शन को व्यापक रूप से बढ़ाने के लिए, OpenAI उच्च गुणवत्ता वाले वीडियो के लाखों घंटे प्रशिक्षण सामग्री के रूप में एकत्र कर रहा है, जो विभिन्न शैलियों और विषयों को कवर करता है, जिसका उद्देश्य मॉडल के偏差 को कम करना और आउटपुट गुणवत्ता को बढ़ाना है।
यह ध्यान देने योग्य है कि Sora के जारी होने के बाद से, वीडियो AI बाजार की प्रतिस्पर्धा तेजी से बढ़ रही है। चीन के बाजार ने क्रमशः 可灵, Vidu, 即梦 AI और MiniMax चार नए सिस्टम लॉन्च किए हैं। इस बीच, Runway ML भी पीछे नहीं है, उसने दो नए AI मॉडल पेश किए हैं और हाल ही में Lionsgate के साथ सहयोग की घोषणा की है। यह प्रतिस्पर्धा निश्चित रूप से पूरे उद्योग के तेजी से विकास को प्रेरित करेगी।
हालांकि OpenAI ने इस साल सितंबर की शुरुआत में CNBC को बताया कि Sora अभी भी अनुसंधान चरण में है और नीति निर्माताओं के साथ गहन चर्चा की आवश्यकता है, लेकिन कंपनी की CTO मीरा मुराती ने मार्च के मध्य में काफी आत्मविश्वास दिखाया। उसने स्पष्ट रूप से कहा कि Sora इस साल के भीतर आधिकारिक रूप से जारी किया जाएगा। हालांकि, मुराती ने यह भी स्वीकार किया कि वर्तमान प्रणाली के संचालन की लागत बहुत अधिक है, जिसे "लक्जरी में लक्जरी" के रूप में वर्णित किया गया है, इसलिए उत्पन्न लागत को कम करना भी OpenAI का एक महत्वपूर्ण कार्य है।
Sora का यह सुधार निश्चित रूप से एक चुनौती और अवसरों से भरी यात्रा है। इसे केवल तकनीकी स्तर की समस्याओं को हल नहीं करना है, बल्कि दक्षता, लागत और गुणवत्ता के बीच संतुलन भी खोजना है। यदि OpenAI इन बाधाओं को सफलतापूर्वक पार कर सकता है, तो Sora वीडियो उत्पादन उद्योग में एक महत्वपूर्ण परिवर्तन शक्ति बन सकता है।
जैसे-जैसे AI तकनीक वीडियो क्षेत्र में गहराई से प्रवेश कर रही है, हम यह पूर्वानुमान लगा सकते हैं कि भविष्य की वीडियो रचनाएँ और भी अधिक कुशल और विविधतापूर्ण होंगी। यह न केवल पेशेवर निर्माताओं को नए उपकरण प्रदान करेगा, बल्कि सामान्य उपयोगकर्ताओं के लिए भी वीडियो निर्माण के नए क्षितिज खोल सकता है। हालाँकि वर्तमान में Sora अभी भी कई चुनौतियों का सामना कर रहा है, लेकिन इसका विकास दिशा निश्चित रूप से वीडियो AI के भविष्य के रुझान का प्रतिनिधित्व करती है।