डौबाओ ने实时语音大模型发布 किया，चीन की अगुवाई，双商在线

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Jan 20, 2025

336

हाल ही में, डौबाओ कंपनी ने अपने नए रीयल-टाइम वॉयस बड़े मॉडल का शुभारंभ किया है, जो कहता है कि यह चीनी संवाद में "अविस्मरणीय बढ़त" हासिल कर चुका है, जो AI संवाद क्षमताओं में महत्वपूर्ण वृद्धि का प्रतीक है। यह मॉडल डौबाओ ऐप (संस्करण संख्या 7.2.0 नए साल संस्करण) में पूरी तरह से खुला है, जो उपयोगकर्ताओं को एक समृद्ध और वास्तविक वॉयस संचार अनुभव प्रदान करता है।

जानकारी के अनुसार, डौबाओ का रीयल-टाइम वॉयस बड़ा मॉडल वॉयस समझ और उत्पत्ति के गहरे एकीकरण को प्राप्त करता है, जिससे एक एंड-टू-एंड वॉयस संवाद प्रणाली बनती है। इस तकनीकी सफलता ने मॉडल की वॉयस प्रदर्शन, नियंत्रण और भावनात्मक समर्पण के मामलों में उत्कृष्टता को बहुत बढ़ा दिया है, जिसमें कम विलंबता और बातचीत को कभी भी बाधित करने की क्षमता है, जो उपयोगकर्ताओं के इंटरैक्शन अनुभव को बहुत बढ़ा देती है। आधिकारिक तौर पर कहा गया है कि यह तकनीक न केवल "बुद्धिमत्ता" में सुधार करती है, बल्कि भावनात्मक बुद्धिमत्ता भी ऑनलाइन है, जिससे यह भावनाओं को बेहतर ढंग से समझने और व्यक्त करने में सक्षम है।

इस अपडेट में रीयल-टाइम वॉयस कॉलिंग फीचर भी शामिल है, जो डौबाओ के नवीनतम बड़े मॉडल पर निर्भर करता है, और विभिन्न परिदृश्यों में बातचीत की गति, बाल स्वर, ध्वनि स्तर और श्वास के जैसे विवरण को लचीले ढंग से समायोजित कर सकता है। इसके अतिरिक्त, नए वॉयस फीचर विभिन्न आवाजों की नकल करने में सक्षम है, विभिन्न बोलियों और अंग्रेजी के साथ संवाद का समर्थन करता है, और यहां तक कि कुछ गानों को गाने की क्षमता भी रखता है। यह सब मानव-मशीन संवाद की वास्तविकता को एक नए स्तर पर ले जाता है, जो "मनुष्य और मशीन के बीच भेद करना मुश्किल" बना देता है।

डौबाओ की अनुसंधान एवं विकास टीम ने कहा कि यह नई तकनीक एंड-टू-एंड ढांचे पर आधारित है, जो मूल विधियों के माध्यम से वॉयस और टेक्स्ट के मॉडल को गहराई से एकीकृत करती है। इस प्रकार की डिजाइन न केवल वॉयस पहचान और उत्पत्ति की प्रक्रियाओं को अनुकूलित करती है, बल्कि AI को एक समृद्ध "आत्मा" भी प्रदान करती है, जिससे यह मानव के साथ बेहतर संवाद कर सके।

डौबाओ का रीयल-टाइम वॉयस बड़ा मॉडल चीनी वॉयस संवाद क्षेत्र में पेश किया गया है, जो उपयोगकर्ताओं को पहले कभी नहीं देखे गए इंटरैक्शन अनुभव प्रदान करेगा, और स्मार्ट वॉयस तकनीक के विकास को आगे बढ़ाएगा।

बाइटडांस के AI इंटेलिजेंट असिस्टेंट डौबाओ ऐप ने लॉन्च किया 'फोटो को गतिमान बनाएं' फीचर

हाल ही में, बाइटडांस के स्वामित्व वाले AI इंटेलिजेंट असिस्टेंट डौबाओ ऐप ने एक नवीनतम फीचर की घोषणा की है - 'फोटो को गतिमान बनाएं'। इस फीचर को लॉन्च करने का उद्देश्य पुरानी तस्वीरों को गतिशील बनाने की उपयोगकर्ताओं की आवश्यकता को पूरा करना है, जिससे वे क्षण जो कभी स्थिर थे, फिर से जीवंत हो सकें। बताया गया है कि 'फोटो को गतिमान बनाएं' फीचर का संचालन आसान है, उपयोगकर्ताओं को केवल डौबाओ ऐप खोलना है, इस फीचर का चयन करना है और एक पुरानी तस्वीर अपलोड करनी है, और फिर तस्वीर में मौजूद व्यक्ति या वस्तु के क्रियाकलाप का वर्णन करना है। थोड़ी देर इंतजार करने के बाद, डौबाओ ऐप उन्नत AI तकनीक का उपयोग करके स्थिर तस्वीर को एक जीवंत वीडियो में बदल देगा।

डौबाओ ऐप ने नया वॉयस मोड पेश किया, GPT-4o से पहले गाने और चरित्र अभिनय करने की क्षमता हासिल की

20 जनवरी 2025 को डौबाओ ऐप ने अपने नवीनतम "एंड-टू-एंड" वॉयस बड़े मॉडल को आधिकारिक रूप से जारी किया और वास्तविक समय की वॉयस कॉलिंग सुविधा में महत्वपूर्ण अपडेट किया। यह प्रगति डौबाओ के लिए वॉयस इंटरैक्शन के क्षेत्र में एक और छलांग को चिह्नित करती है, जो पिछले ASR (स्वचालित वॉयस पहचान), LLM (बड़ा भाषा मॉडल) और TTS (पाठ से ऑडियो) के संबंध में सीधाई समाधान से आगे बढ़ता है, जो वॉयस पहचान, समझ और उत्पादन को एक ही मॉडल में एकीकृत करता है। "इंटेलिजेंट इमर्जेंस" के परीक्षण के अनुसार, नए डौबाओ की प्रमुख विशेषता इसकी मानव जैसी विशेषताएँ हैं।

बाइटडांस एआई सहायक डौबाओ ऐप और डेस्कटॉप पर संगीत निर्माण फ़ंक्शन लॉन्च

बाइटडांस के तहत डौबाओ एआई सहायक ने हाल ही में एक नया फ़ंक्शन - संगीत निर्माण लॉन्च किया है। उपयोगकर्ता को बस डौबाओ ऐप या डेस्कटॉप पर 'संगीत निर्माण' पर क्लिक करना होगा, कीवर्ड या अनुकूलित गीत लिखना होगा और संबंधित संगीत शैली, मूड और वोकल का चयन करना होगा, और एक अद्वितीय गीत उत्पन्न कर सकते हैं। यह फ़ंक्शन उपयोगकर्ताओं को संगीत निर्माण के सपनों को साकार करने में मदद करने और अपने भावनाओं और कहानियों को संगीत के जरिए व्यक्त करने का लक्ष्य रखता है।

AI समाचार

डौबाओ ने实时语音大模型发布 किया，चीन की अगुवाई，双商在线

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

बाइटडांस के AI इंटेलिजेंट असिस्टेंट डौबाओ ऐप ने लॉन्च किया 'फोटो को गतिमान बनाएं' फीचर

डौबाओ ऐप ने नया वॉयस मोड पेश किया, GPT-4o से पहले गाने और चरित्र अभिनय करने की क्षमता हासिल की

बाइटडांस एआई सहायक डौबाओ ऐप और डेस्कटॉप पर संगीत निर्माण फ़ंक्शन लॉन्च