Teuken-7B, एक 70 अरब पैरामीटर वाला भाषा मॉडल, अब Hugging Face पर उपलब्ध है, जो सभी 24 आधिकारिक यूरोपीय संघ की भाषाओं का समर्थन करता है। यह मॉडल यूरोपीय संघ के OpenGPT-X अनुसंधान परियोजना द्वारा विकसित किया गया है और उपयोगकर्ताओं के लिए एक ओपन-सोर्स प्रोजेक्ट के रूप में उपलब्ध है। अधिकांश अंग्रेजी-केंद्रित AI भाषा मॉडलों के विपरीत, Teuken-7B को शून्य से बनाया गया है, जिसमें लगभग आधा प्रशिक्षण डेटा गैर-अंग्रेजी यूरोपीय भाषाओं से लिया गया है。
छवि स्रोत टिप्पणी: छवि AI द्वारा उत्पन्न की गई है, छवि अनुबंध सेवा प्रदाता Midjourney
विकास टीम ने बताया कि Teuken-7B सभी प्रशिक्षित भाषाओं में उत्कृष्ट प्रदर्शन करता है, विशेष रूप से गैर-अंग्रेजी भाषाओं को संभालने में इसकी विश्वसनीयता प्रभावशाली है। यूरोपीय भाषाओं में भाषा मॉडल के प्रदर्शन को मापने के लिए, परियोजना टीम ने एक नया यूरोपीय LLM रैंकिंग सूची भी बनाई है, जो पहले के मुख्य रूप से अंग्रेजी-आधारित मानक परीक्षण विधियों से परे है।
यह रिलीज बहुभाषी कृत्रिम बुद्धिमत्ता मॉडल को बढ़ावा देने में यूरोप की महत्वपूर्ण प्रगति का प्रतीक है, और डेवलपर्स को क्रॉस-लैंग्वेज एप्लिकेशन और अनुसंधान का समर्थन करने के लिए एक शक्तिशाली और विविध उपकरण प्रदान करता है।