Le 22 janvier 2025, Volcano Engine, filiale de ByteDance, a annoncé le lancement officiel de son grand modèle linguistique Doubao 1.5 et sa mise en ligne complète sur la plateforme Volcano Ark. Cette version améliorée affiche des performances significativement accrues dans plusieurs domaines, atteignant un niveau mondial de pointe et marquant une nouvelle avancée majeure de ByteDance dans le domaine de l'intelligence artificielle.

Doubao 1.5 comprend plusieurs versions. Doubao-1.5-pro obtient les meilleurs résultats sur plusieurs benchmarks de référence, notamment en matière de connaissances, de code, de raisonnement et de traitement du chinois, surpassant des modèles de pointe tels que GPT-4o et Claude3.5 Sonnet. Doubao-1.5-lite excelle quant à lui parmi les modèles linguistiques légers, atteignant des performances comparables à la version précédente Doubao-pro-32k-0828, offrant ainsi un meilleur rapport qualité-prix. Enfin, Doubao-1.5-vision-pro a bénéficié d'améliorations significatives en matière de synthèse de données multimodales, de résolution dynamique et d'alignement multimodal, améliorant ainsi ses capacités de raisonnement visuel et de compréhension des informations granulaires, et obtenant des résultats de pointe sur plusieurs benchmarks.

微信截图_20250122134135.png

Cette version inclut également le modèle de synthèse vocale en temps réel Doubao, permettant des conversations vocales de bout en bout avec une faible latence et la possibilité d'interrompre à tout moment. Volcano Engine prévoit de lancer les API correspondantes via la plateforme Ark au cours du premier semestre, favorisant ainsi une adoption plus large de cette technologie vocale.

Doubao 1.5 repose sur une architecture MoE (Mixture of Experts) massivement parcimonieuse, atteignant des performances équivalentes à un modèle Dense avec 7 fois plus de paramètres d'activation, tout en utilisant un nombre de paramètres d'activation beaucoup plus réduit. Parallèlement, les solutions de cluster de serveurs et les technologies de cartes réseau développées en interne par ByteDance réduisent considérablement les coûts matériels et optimisent l'efficacité des communications à faible volume de données, garantissant ainsi la stabilité et l'efficacité de l'inférence distribuée multi-machines. De plus, Doubao 1.5 n'a utilisé aucune donnée générée par d'autres modèles lors de son entraînement, s'appuyant sur un système de production de données entièrement autonome pour garantir l'indépendance et la fiabilité des sources de données.

Il est important de noter que malgré l'amélioration significative des performances et des fonctionnalités de Doubao 1.5, son prix reste inchangé, conformément à la politique « plus de contenu, même prix », afin de promouvoir l'accessibilité de l'IA et de permettre à un plus grand nombre d'entreprises et de développeurs de bénéficier de cette technologie de pointe.

Adresse d'essai : https://team.doubao.com/doubao_1_5_pro