Teuken-7B, ein Sprachmodell mit 7 Milliarden Parametern, ist jetzt auf Hugging Face verfügbar und unterstützt alle 24 offiziellen Sprachen der Europäischen Union. Das Modell wurde im Rahmen des EU-Forschungsprojekts OpenGPT-X entwickelt und steht als Open-Source-Projekt zur Verfügung. Im Gegensatz zu den meisten auf Englisch ausgerichteten KI-Sprachmodellen wurde Teuken-7B von Grund auf neu entwickelt, wobei etwa die Hälfte der Trainingsdaten aus nicht-englischen europäischen Sprachen stammt.

Gehirn Großes Sprachmodell

Bildquelle: Das Bild wurde mit KI generiert und stammt von Midjourney.

Das Entwicklerteam berichtet, dass Teuken-7B in allen trainierten Sprachen hervorragende Leistungen zeigt, insbesondere bei der Verarbeitung nicht-englischer Sprachen ist seine Zuverlässigkeit beeindruckend. Um die Leistung von Sprachmodellen in europäischen Sprachen zu messen, hat das Projektteam außerdem eine neue Rangliste für europäische LLMs erstellt, die über die bisherigen, hauptsächlich auf Englisch basierenden Standardtestmethoden hinausgeht.

Diese Veröffentlichung markiert einen bedeutenden Fortschritt Europas in der Entwicklung mehrsprachiger KI-Modelle und bietet Entwicklern ein leistungsstarkes und vielseitiges Werkzeug zur Unterstützung sprachübergreifender Anwendungen und Forschung.