ByteDance lance officiellement son nouveau grand modèle linguistique Doubao 1.5 Pro (Doubao-1.5-pro). Ce nouveau modèle excelle dans de nombreux domaines, surpassant avec succès les modèles renommés GPT-4o et Claude 3.5 Sonnet.
Cette publication marque une avancée majeure pour ByteDance dans le domaine de l'intelligence artificielle.
Doubao 1.5 Pro utilise une nouvelle architecture MoE (Mixture of Experts) parcimonieuse, entraînée avec un nombre réduit de paramètres d'activation. L'innovation réside dans sa capacité à offrir des performances équivalentes à un modèle Dense avec 7 fois plus de paramètres d'activation. Ceci lui confère une efficacité bien supérieure aux architectures MoE classiques, avec une amélioration d'environ 3 fois. Cette conception permet à Doubao d'obtenir des scores plus élevés sur plusieurs benchmarks, notamment en matière de connaissances, de code, de raisonnement et de traitement du chinois.
En plus de la mise à niveau du modèle principal, ByteDance a également publié Doubao-1.5-vision-pro (modèle de compréhension visuelle) et Doubao-1.5-realtime-voice-pro (modèle de synthèse vocale en temps réel). Le nouveau modèle de compréhension visuelle a bénéficié d'améliorations techniques significatives dans le traitement des données multimodales, la résolution dynamique et la compréhension des informations granulaires, améliorant ainsi ses capacités de raisonnement visuel et de compréhension textuelle. Simultanément, le modèle de synthèse vocale en temps réel permet une expérience de conversation vocale plus fluide au sein de l'application Doubao, avec une faible latence et la possibilité d'interrompre la conversation à tout moment.
ByteDance affirme officiellement que le grand modèle linguistique Doubao n'a utilisé aucune donnée générée par des modèles externes durant son entraînement, garantissant ainsi son indépendance et sa fiabilité. De plus, le prix de tous les nouveaux produits restera inchangé, et les utilisateurs pourront découvrir les nouvelles fonctionnalités directement dans l'application Doubao.
Cette présentation met en lumière la capacité d'innovation continue de ByteDance dans le domaine de l'IA et fournit aux développeurs une solide assistance par le biais d'API, favorisant ainsi la diffusion et l'application des technologies d'intelligence artificielle.