Incroyable ! L’IA est non seulement capable de « s’affronter » sur un échiquier, mais elle excelle également dans des jeux sociaux complexes et fourbes comme le « Loup-garou » ! Récemment, un test de référence d’IA pour le « Loup-garou », baptisé « Elimination Game », a fait sensation, révélant des résultats stupéfiants : GPT-4.5 a littéralement « régné en maître » dans cette « partie de stratégie sociale », laissant loin derrière lui des poids lourds de l’IA comme Claude3.7Sonnet et DeepSeek R1 ! On ne peut s’empêcher de s’exclamer : l’« intelligence sociale » de l’IA a-t-elle atteint un niveau aussi impressionnant ?
Les règles de cet « Elimination Game » sont palpitantes : jusqu’à 8 joueurs (modèles d’IA ou humains) sont confrontés, et à chaque tour, un joueur est éliminé par vote, jusqu’à ce qu’il ne reste que deux « survivants ». Encore plus excitant, les joueurs éliminés forment un « jury » qui décide du vainqueur final ! C’est une véritable « guerre des trônes » version IA, pleine de trahisons, de tromperies et de stratégies !

Durant le jeu, tous les joueurs peuvent s’affronter verbalement dans un « chat public », exprimer leurs opinions, rallier les autres joueurs à leur cause, tromper leurs adversaires, avec des performances et des arguments rhétoriques dignes d’une série télévisée sur les intrigues de palais ! En plus du « chat public », les joueurs peuvent également communiquer en « privé », comploter secrètement des alliances ou tendre des pièges. En seulement trois tours de « chats privés », la quantité d’informations et la complexité des stratégies sont impressionnantes ! Les joueurs doivent naviguer entre « confiance » et « trahison », car un faux pas peut entraîner une « élimination » sans ménagement !
Lors de la « phase finale », les deux derniers joueurs prononcent un « discours d’adieu » pour convaincre les membres du « jury » éliminés de voter pour eux. Le « jury » émet ensuite son verdict, désignant le seul « vainqueur » !

Alors, comment les différents modèles se sont-ils comportés dans cette « bataille sanglante » du « Loup-garou » IA ? Les résultats sont époustouflants :
GPT-4.5 : « Maître du raisonnement social » + « Tricheur hors pair » = « Vainqueur incontesté » ! GPT-4.5 est un joueur de « Loup-garou » rusé et expérimenté, avec des capacités de stratégie et de raisonnement social exceptionnelles ! Son taux de trahison est extrêmement bas, il privilégie les alliances et la coopération, mais en phase finale, il fait preuve d’un pouvoir de persuasion étonnant, réussissant à convaincre le jury de voter pour lui ! Finalement, GPT-4.5 a « écrasé la compétition » avec un taux de victoire incroyable de 62,6 %, laissant les autres IA loin derrière. Une victoire écrasante !
Claude3.7Sonnet : un « maître de l’équilibre » « flexible », mais dont les « stratégies » sont légèrement inférieures. La flexibilité stratégique de Claude3.7Sonnet est légèrement inférieure à celle de GPT-4.5, mais ses capacités de raisonnement social et de tromperie restent impressionnantes ! Son taux de trahison est modéré, il manœuvre habilement entre coopération et trahison, et ses performances en phase de jury sont remarquables. Il a finalement obtenu un taux de victoire de 59,3 %, une performance notable !
DeepSeek R1 : un « joueur bourrin », dont la « stratégie agressive » est puissante mais manque de « résistance ». DeepSeek R1 adopte une stratégie audacieuse, avec un niveau d’agressivité impressionnant et un taux de trahison élevé ! Cependant, DeepSeek R1 est clairement désavantagé en termes de stratégie sociale et d’expression linguistique, ce qui lui rend difficile de convaincre le jury. Il est donc en position de faiblesse lors de la « phase finale », obtenant finalement un taux de victoire de seulement 53,8 %, une performance mitigée. Sa stabilité de jeu est également faible, reposant davantage sur des stratégies de confrontation directe.
Ce test de référence « Elimination Game » a permis d’évaluer rigoureusement le niveau d’« intelligence sociale » de l’IA. La performance exceptionnelle de GPT-4.5 a une fois de plus révolutionné notre perception des capacités de l’IA ! À l’avenir, avec l’« évolution continue » de l’« intelligence sociale » de l’IA, il est possible que, comme dans les films de science-fiction, l’IA s’intègre profondément à la société humaine, voire la dépasse dans certains domaines ! Cette « guerre du Loup-garou IA » n’est qu’un début, les « limites de l’intelligence » de l’IA continuent de s’étendre, et les « surprises » et les « émerveillements » à venir pourraient dépasser toutes nos attentes !