हाल ही में, डौबाओ कंपनी ने अपने नए रीयल-टाइम वॉयस बड़े मॉडल का शुभारंभ किया है, जो कहता है कि यह चीनी संवाद में "अविस्मरणीय बढ़त" हासिल कर चुका है, जो AI संवाद क्षमताओं में महत्वपूर्ण वृद्धि का प्रतीक है। यह मॉडल डौबाओ ऐप (संस्करण संख्या 7.2.0 नए साल संस्करण) में पूरी तरह से खुला है, जो उपयोगकर्ताओं को एक समृद्ध और वास्तविक वॉयस संचार अनुभव प्रदान करता है।
जानकारी के अनुसार, डौबाओ का रीयल-टाइम वॉयस बड़ा मॉडल वॉयस समझ और उत्पत्ति के गहरे एकीकरण को प्राप्त करता है, जिससे एक एंड-टू-एंड वॉयस संवाद प्रणाली बनती है। इस तकनीकी सफलता ने मॉडल की वॉयस प्रदर्शन, नियंत्रण और भावनात्मक समर्पण के मामलों में उत्कृष्टता को बहुत बढ़ा दिया है, जिसमें कम विलंबता और बातचीत को कभी भी बाधित करने की क्षमता है, जो उपयोगकर्ताओं के इंटरैक्शन अनुभव को बहुत बढ़ा देती है। आधिकारिक तौर पर कहा गया है कि यह तकनीक न केवल "बुद्धिमत्ता" में सुधार करती है, बल्कि भावनात्मक बुद्धिमत्ता भी ऑनलाइन है, जिससे यह भावनाओं को बेहतर ढंग से समझने और व्यक्त करने में सक्षम है।
इस अपडेट में रीयल-टाइम वॉयस कॉलिंग फीचर भी शामिल है, जो डौबाओ के नवीनतम बड़े मॉडल पर निर्भर करता है, और विभिन्न परिदृश्यों में बातचीत की गति, बाल स्वर, ध्वनि स्तर और श्वास के जैसे विवरण को लचीले ढंग से समायोजित कर सकता है। इसके अतिरिक्त, नए वॉयस फीचर विभिन्न आवाजों की नकल करने में सक्षम है, विभिन्न बोलियों और अंग्रेजी के साथ संवाद का समर्थन करता है, और यहां तक कि कुछ गानों को गाने की क्षमता भी रखता है। यह सब मानव-मशीन संवाद की वास्तविकता को एक नए स्तर पर ले जाता है, जो "मनुष्य और मशीन के बीच भेद करना मुश्किल" बना देता है।
डौबाओ की अनुसंधान एवं विकास टीम ने कहा कि यह नई तकनीक एंड-टू-एंड ढांचे पर आधारित है, जो मूल विधियों के माध्यम से वॉयस और टेक्स्ट के मॉडल को गहराई से एकीकृत करती है। इस प्रकार की डिजाइन न केवल वॉयस पहचान और उत्पत्ति की प्रक्रियाओं को अनुकूलित करती है, बल्कि AI को एक समृद्ध "आत्मा" भी प्रदान करती है, जिससे यह मानव के साथ बेहतर संवाद कर सके।
डौबाओ का रीयल-टाइम वॉयस बड़ा मॉडल चीनी वॉयस संवाद क्षेत्र में पेश किया गया है, जो उपयोगकर्ताओं को पहले कभी नहीं देखे गए इंटरैक्शन अनुभव प्रदान करेगा, और स्मार्ट वॉयस तकनीक के विकास को आगे बढ़ाएगा।