हाल ही में, Stability AI कंपनी ने एक क्रांतिकारी वीडियो प्रोसेसिंग तकनीक - Stable Video4D - की घोषणा की। यह तकनीक एकल दृष्टिकोण के वीडियो को 8 विभिन्न दृष्टिकोणों में नए दृष्टिकोण वीडियो में परिवर्तित कर सकती है, जिससे निर्माताओं को अभूतपूर्व लचीलापन और रचनात्मकता मिलती है।

Stable Video4D कंपनी द्वारा पहले लॉन्च किए गए Stable Video Diffusion मॉडल पर आधारित है। जहां छवियों को वीडियो में परिवर्तित करना होता है, नए मॉडल वीडियो इनपुट ले सकता है और कई नए दृष्टिकोणों का वीडियो आउटपुट उत्पन्न कर सकता है, जिससे छवि-आधारित वीडियो निर्माण से पूर्ण 3D गतिशील वीडियो संश्लेषण में एक महत्वपूर्ण छलांग लगाई जा रही है।

उपयोग करते समय, उपयोगकर्ताओं को केवल एक वीडियो अपलोड करना होगा और आवश्यक 3D कैमरा स्थिति निर्दिष्ट करनी होगी, Stable Video4D 8 नए दृष्टिकोणों का वीडियो उत्पन्न कर देगा, जो उपयोगकर्ताओं को सभी दिशाओं में बहु-दृष्टिकोण प्रदान करता है। वर्तमान में, यह मॉडल लगभग 40 सेकंड में 8 दृष्टिकोणों के 5 फ्रेम वीडियो उत्पन्न कर सकता है, जबकि पूरा 4D अनुकूलन प्रक्रिया लगभग 20-25 मिनट लेती है।

पहले की विधियों की तुलना में, Stable Video4D एक साथ कई नए दृष्टिकोण वीडियो उत्पन्न कर सकता है, जो स्थान और समय पर एकरूपता को काफी बढ़ाता है। यह न केवल विभिन्न दृष्टिकोणों और समय बिंदुओं पर वस्तुओं की एकरूपता सुनिश्चित करता है, बल्कि एक हल्के 4D अनुकूलन ढांचे को भी साकार करता है।

QQ_1721866365855.png

Stability AI का कहना है कि Stable Video4D वर्तमान में अनुसंधान चरण में है और भविष्य में गेम विकास, वीडियो संपादन और वर्चुअल रियलिटी जैसे क्षेत्रों में व्यापक उपयोग की उम्मीद है। कंपनी अधिक व्यापक वास्तविक दुनिया के वीडियो को संसाधित करने के लिए मॉडल को सक्रिय रूप से अनुकूलित कर रही है।

Stable Video4D अब Hugging Face प्लेटफॉर्म पर उपयोग के लिए उपलब्ध है। Stability AI निरंतर अनुसंधान और विकास के माध्यम से इस तकनीक के वास्तविकता से मिलते-जुलते बहु-दृष्टिकोण वीडियो बनाने की क्षमता को और बढ़ाने की उम्मीद करती है। कंपनी तकनीकी नवाचार को बढ़ावा देने और मॉडल के प्रदर्शन में सुधार करने के लिए शोधकर्ताओं, विशेषज्ञों और समुदाय के साथ सहयोग करना जारी रखेगी।

मॉडल पता: https://huggingface.co/stabilityai/sv4d