ByteDance hat offiziell sein neuestes großes Sprachmodell Doubao-1.5-Pro vorgestellt. Dieses neue Modell zeichnet sich durch seine überragende Leistung in verschiedenen Bereichen aus und übertrifft bekannte Modelle wie GPT-4o und Claude3.5Sonnet. Die Veröffentlichung dieses Modells markiert einen weiteren wichtigen Schritt von ByteDance im Bereich der künstlichen Intelligenz.

Doubao-1.5-Pro verwendet eine neuartige Sparse MoE (Mixture of Experts)-Architektur und trainiert mit geringeren Aktivierungsparametern. Die Innovation dieses Designs liegt in seiner Fähigkeit, eine Leistung zu liefern, die der eines Dense-Modells mit dem 7-fachen an Aktivierungsparametern entspricht. Dies macht es deutlich effizienter als herkömmliche MoE-Architekturen und erzielt eine etwa dreifache Effizienzsteigerung. Dieses Design führt zu besseren Ergebnissen in verschiedenen Benchmarks, darunter Wissen, Code, Schlussfolgerungen und die Verarbeitung chinesischer Sprache.

image.png

Neben dem Upgrade des Hauptmodells hat ByteDance auch das Doubao-Bildverständnismodell Doubao-1.5-vision-pro und das Doubao-Echtzeit-Sprachmodell Doubao-1.5-realtime-voice-pro veröffentlicht. Das neue Bildverständnismodell wurde umfassend technisch verbessert, insbesondere in Bezug auf die Verarbeitung multimodaler Daten, dynamische Auflösung und das Verständnis fein granularer Informationen. Dies verbessert seine Fähigkeiten in den Bereichen visuelle Schlussfolgerungen und Textverständnis. Das Echtzeit-Sprachmodell ermöglicht eine flüssigere Sprachdialogerfahrung in der Doubao-App mit geringer Latenz und der Möglichkeit, Unterbrechungen während des Gesprächs zuzulassen.

image.png

ByteDance gab offiziell bekannt, dass bei dem Training des Doubao-Sprachmodells keine Daten externer Modelle verwendet wurden, um die Unabhängigkeit und Zuverlässigkeit des Modells zu gewährleisten. Darüber hinaus bleiben die Preise aller neuen Produkte unverändert. Benutzer können die neuen Funktionen direkt in der Doubao-App erleben.

image.png

Diese Veröffentlichung zeigt nicht nur die kontinuierliche Innovationskraft von ByteDance im Bereich der KI, sondern bietet Entwicklern auch eine starke API-Unterstützung, um die Verbreitung und Anwendung von KI-Technologien weiter voranzutreiben.