2024 की विश्व आर्टिफिशियल इंटेलिजेंस कॉन्फ्रेंस (WAIC) में, सेंस टाइम टेक्नोलॉजी ने एक नियंत्रित व्यक्ति वीडियो जनरेशन मॉडल - Vimi पेश किया। Vimi मॉडल सेंस टाइम की उन्नत बड़े मॉडल तकनीक का उपयोग करता है, जो एक ही फोटो के माध्यम से लक्षित क्रिया के अनुरूप व्यक्ति वीडियो उत्पन्न कर सकता है, सटीक भावनाओं और शारीरिक नियंत्रण को प्राप्त करता है। यह मॉडल कई ड्राइविंग विधियों का समर्थन करता है, जिसमें वीडियो, एनिमेशन, आवाज़ और टेक्स्ट शामिल हैं, जिसमें वर्षों के संचित चेहरे ट्रैकिंग तकनीक और विवरणों पर सटीक नियंत्रण की क्षमता है, जो उच्च संगति, प्रकाश और छाया में सामंजस्यपूर्ण वीडियो सामग्री उत्पन्न कर सकता है।

Vimi की स्थिरता विशेष रूप से उल्लेखनीय है, यह 1 मिनट से अधिक के एकल शॉट व्यक्ति वीडियो उत्पन्न कर सकता है, और समय के साथ चित्र प्रभाव खराब नहीं होता है। यह व्यक्ति की क्रियाओं के आधार पर पर्यावरण दृश्य को समायोजित कर सकता है, कैमरे के कोण में बदलाव और बालों की हिलने की नकल कर सकता है, वास्तविकवादी दृश्य प्रभाव प्रदान करता है। इसके अलावा, Vimi प्रकाश और छाया के परिवर्तन की नकल का समर्थन करता है, वीडियो निर्माताओं को समृद्ध रचनात्मक स्वतंत्रता प्रदान करता है।

微信截图_20240709140907.png

Vimi कैमरा Vimi बड़े मॉडल पर आधारित पहला C-एंड एप्लिकेशन है, जो मुख्य रूप से महिलाओं के उपयोगकर्ताओं के लिए है, जो उनकी मनोरंजन रचनात्मक आवश्यकताओं को पूरा करता है। उपयोगकर्ता विभिन्न कोणों से उच्च गुणवत्ता वाली व्यक्ति छवियों को अपलोड करने के बाद, Vimi कैमरा स्वचालित रूप से डिजिटल अवतार और विभिन्न शैलियों के फोटो वीडियो उत्पन्न कर सकता है, जो विविधता में उत्पन्न शैली प्रदान करता है। Vimi कैमरा एकल छवि के माध्यम से मजेदार व्यक्ति इमोजी पैक उत्पन्न करने का भी समर्थन करता है, जिसमें कई प्रकार के खेल होते हैं, जो व्यक्तिगत रचनात्मकता को साकार करता है।

वर्तमान में, Vimi कैमरा आंतरिक परीक्षण के लिए खुला है, इच्छुक उपयोगकर्ता पब्लिक अकाउंट का अनुसरण करके और预约 लिंक भरकर अनुभव के लिए आवेदन कर सकते हैं।