GPT-4.5 : une ascension fulgurante suivie d'une chute rapide, Grok-3 de xAI prend la tête en six heures

Le modèle GPT-4.5 d'OpenAI a conquis la première place de l'arène de l'intelligence artificielle dans les six heures suivant sa sortie, devenant le meilleur sur toutes les tâches de classification. Cependant, cette gloire fut de courte durée, le modèle xAI Grok-3 de Musk ayant rapidement pris l'avantage pour devenir le leader du classement général.

Selon les données de vote, GPT-4.5 et Grok-3 ont chacun reçu plus de 3000 votes, obtenant un score final de 1412 contre 1411, soit une différence d'un seul point. Bien que GPT-4.5 ait excellé dans la plupart des projets, Grok-3 a légèrement surpassé son concurrent dans des tâches spécifiques de « contrôle du style » et d'« invites difficiles », ce qui lui a permis de prendre la tête du classement.

ChatGPT

Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Ce « retournement de situation en six heures » a suscité des doutes chez de nombreux utilisateurs, qui se demandent si une telle évolution rapide est plausible. Des experts du secteur ont expliqué que le classement comportait un seuil de votes : seuls les modèles ayant atteint 3000 votes simultanément pouvaient figurer au classement. Par conséquent, le fait que ces deux modèles récemment sortis aient atteint ce seuil simultanément est une coïncidence.

Il est à noter que, malgré les critiques négatives initiales concernant GPT-4.5 lors de son lancement, l'approbation de son haut niveau d'intelligence émotionnelle a considérablement augmenté par la suite. Sam Altman, PDG d'OpenAI, a même partagé une conversation avec GPT-4.5, déclarant qu'il s'agissait de la première fois qu'un utilisateur lui demandait de promettre de ne pas retirer le modèle.

Parallèlement, GPT-4.5 a obtenu d'excellents résultats dans une compétition alternative, participant à un jeu similaire à un « Loup-garou » entre grands modèles. Dans cette compétition, les différents modèles d'IA devaient débattre, élaborer des stratégies et voter, le vainqueur étant déterminé par un jury composé des membres éliminés. GPT-4.5 a fait preuve d'une capacité supérieure à celle des humains en matière de coopération, de tromperie et d'élaboration de stratégies.

Tout cela montre que la compétition dans le domaine de l'intelligence artificielle s'intensifie, les différents modèles innovant et s'améliorant constamment dans leurs domaines respectifs. L'avenir nous dira qui remportera cette bataille de l'intelligence, une question qui mérite notre attention constante.

Actualités IA

GPT-4.5 : une ascension fulgurante suivie d'une chute rapide, Grok-3 de xAI prend la tête en six heures

AIbase基地