Meta ने SeamlessM4T नामक एक AI अनुवाद मॉडल जारी किया है, जो लगभग 100 भाषाओं के लिए वॉयस-टू-टेक्स्ट, टेक्स्ट-टू-टेक्स्ट और टेक्स्ट-टू-वॉयस अनुवाद का समर्थन करता है। SeamlessM4T की वॉयस पहचान क्षमता मानव स्तर तक पहुँच गई है, और पृष्ठभूमि ध्वनि और परिवर्तित आवाज़ों को संभालने की क्षमता में भी काफी सुधार हुआ है। Meta ने न केवल अनुसंधान लाइसेंस के रूप में SeamlessM4T मॉडल को मुफ्त में ओपन-सोर्स किया है, बल्कि इस मॉडल के प्रमुख प्रशिक्षण डेटा सेट SeamlessAlign को भी सार्वजनिक किया है। यह अब तक का सबसे बड़ा सार्वजनिक डेटा सेट है जो मल्टी-मोड अनुवाद के लिए उपयोग किया गया है। SeamlessM4T का विमोचन एक बिना भाषा बाधाओं की दुनिया की ओर एक बड़ा कदम माना जाता है। हालांकि मॉडल में अभी भी कुछ पूर्वाग्रह और त्रुटियाँ हैं, लेकिन Meta SeamlessM4T के आधार पर आगे अनुसंधान और सुधार करने की योजना बना रहा है।
100 भाषाओं में सीधे अनुवाद! मेटा ने SeamlessM4T नया मॉडल पेश किया, मूल डेटा सेट भी ओपन-सोर्स किया

36氪
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।