SeamlessM4T

Meta ने दुनिया के सबसे बड़े मल्टी-मोडल अनुवाद मॉडल SeamlessM4T को ओपन-सोर्स किया है, जो 100 भाषाओं का समर्थन करता है और स्थानीय भाषाओं को पहचान सकता है। यह मॉडल आवाज से पाठ, आवाज से आवाज, पाठ से आवाज और पाठ से पाठ के मल्टी-मोडल अनुवाद कार्य कर सकता है। SeamlessM4T ने Meta द्वारा पहले जारी किए गए NLLB, MMS जैसे अनुवाद मॉडलों को एकीकृत किया है और इसे बड़ी मात्रा में आवाज और पाठ संरेखण डेटा का उपयोग करके प्रशिक्षित किया गया है। इस मॉडल ने मल्टी-टास्क अनुवाद में उन्नत परिणाम प्राप्त किए हैं और मजबूती परीक्षणों में उत्कृष्ट प्रदर्शन किया है, विशेष रूप से पृष्ठभूमि शोर और बोलने वाले के परिवर्तन की पहचान में। साथ ही, इस मॉडल ने मध्य और निम्न संसाधन भाषाओं के प्रदर्शन में महत्वपूर्ण सुधार किया है।