MinMo

MinMo एक बहु-मोडल बड़ा भाषा मॉडल है, जो निर्बाध आवाज़ इंटरैक्शन के लिए डिज़ाइन किया गया है।

सामान्य उत्पादचैटिंगआवाज़ इंटरैक्शनबहु-मोडल
MinMo अलीबाबा ग्रुप के Tongyi लैब द्वारा विकसित एक बहु-मोडल बड़ा भाषा मॉडल है, जिसमें लगभग 8 अरब पैरामीटर हैं, और जो निर्बाध आवाज़ इंटरैक्शन पर केंद्रित है। इसे कई चरणों में प्रशिक्षित किया गया है, जिसमें आवाज़ से टेक्स्ट अलाइनमेंट, टेक्स्ट से आवाज़ अलाइनमेंट, आवाज़ से आवाज़ अलाइनमेंट और फुल-डुप्लेक्स इंटरैक्शन अलाइनमेंट शामिल हैं, और इसे 14 लाख घंटे के विविध आवाज़ डेटा और व्यापक आवाज़ कार्यों पर प्रशिक्षित किया गया है। MinMo ने आवाज़ समझ और उत्पादन के विभिन्न बेंचमार्क में अत्याधुनिक प्रदर्शन हासिल किया है, साथ ही टेक्स्ट बड़े भाषा मॉडल की क्षमता को भी बनाए रखा है, और फुल-डुप्लेक्स संवाद का समर्थन करता है, अर्थात उपयोगकर्ता और सिस्टम के बीच एक साथ द्विदिश संचार। इसके अलावा, MinMo एक नए और सरल आवाज़ डिकोडर को भी प्रस्तुत करता है, जो आवाज़ उत्पादन में पिछले मॉडल से आगे निकल गया है। MinMo की निर्देश पालन करने की क्षमता को बढ़ाया गया है, जो उपयोगकर्ता के निर्देशों के अनुसार आवाज़ उत्पादन को नियंत्रित करने का समर्थन करता है, जिसमें भावनाएँ, बोलियाँ और गति जैसी बारीकियाँ शामिल हैं, और विशिष्ट आवाज़ों की नकल भी करता है। MinMo का आवाज़ से टेक्स्ट विलंब लगभग 100 मिलीसेकंड है, फुल-डुप्लेक्स विलंब सैद्धांतिक रूप से लगभग 600 मिलीसेकंड है, जबकि वास्तविक लगभग 800 मिलीसेकंड है। MinMo का विकास पिछले मल्टी-मोडल मॉडल की मुख्य सीमाओं को दूर करने के उद्देश्य से किया गया है, ताकि उपयोगकर्ताओं को अधिक प्राकृतिक, सहज और मानवीय आवाज़ इंटरैक्शन अनुभव प्रदान किया जा सके।
वेबसाइट खोलें

MinMo नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

63960

बाउंस दर

57.97%

प्रति विज़िट औसत पृष्ठ

1.4

औसत विज़िट अवधि

00:00:54

MinMo विज़िट प्रवृत्ति

MinMo विज़िट भौगोलिक वितरण

MinMo ट्रैफ़िक स्रोत

MinMo विकल्प