Les données montrent que les deux modèles de l'équipe xAI, Grok-2 et Grok-Mini, ont officiellement intégré le classement LMSys Arena des robots conversationnels. Grok-2 s'est particulièrement distingué en obtenant la deuxième place, surpassant même GPT-4o d'OpenAI (mai), et se plaçant à égalité avec le dernier modèle Gemini. Ce succès est soutenu par plus de 6000 votes positifs de la communauté.
Il est important de noter que Grok-2 a particulièrement brillé dans les tâches mathématiques, remportant la première place de cette catégorie. Il a également obtenu d'excellents résultats, se classant deuxième dans plusieurs autres tâches, notamment les invites complexes, la programmation et le suivi d'instructions. Grok-2-Mini, quant à lui, a fait une entrée remarquée dans le classement en se positionnant à la cinquième place.
Grok-2-Mini a également bénéficié d'une amélioration significative de sa vitesse, fonctionnant désormais deux fois plus vite qu'auparavant. Cette avancée spectaculaire est le fruit du travail de l'équipe d'inférence de xAI, qui a entièrement réécrit la pile d'inférence en utilisant SGLang pour une inférence multi-hôtes plus efficace et une précision accrue. L'équipe a également introduit de nouveaux algorithmes de calcul et de communication, ainsi qu'une meilleure planification par lots et des techniques de quantification, améliorant ainsi les performances globales du modèle.
Bien que certains restent sceptiques quant aux performances de Grok-2, estimant que GPT-4o d'OpenAI est supérieur, de nombreux utilisateurs affirment que Grok-2 excelle en programmation et en mathématiques. La série de modèles Grok-2 a été lancée en version bêta ce mois-ci et est accessible aux utilisateurs via la plateforme X. De plus, le modèle prend en charge la création d'images à l'aide du modèle de génération d'images FLUX.1.
Points clés :
✨ Grok-2 se classe deuxième au classement LMSys des robots conversationnels, dépassant GPT-4o (mai) et se positionnant à égalité avec Gemini.
🚀 Grok-2 excelle dans les tâches mathématiques, obtenant la première place et se classant parmi les meilleurs dans plusieurs autres tâches.
💡 Grok-2-Mini a vu sa vitesse doubler, améliorant ainsi considérablement ses performances.