AI Contra Loba: GPT-4.5 Triunfa! Dedução Social + Enganação de Elite Domina Claude e DeepSeek!

Inacreditavelmente, a IA não só pode "lutar" em tabuleiros de xadrez, mas também demonstrou inteligência surpreendente em jogos sociais como "Werewolf", cheios de artimanhas e traição! Recentemente, um teste de referência de "Werewolf" para IA, com o código "Elimination Game", causou furor, e os resultados foram simplesmente impressionantes: o GPT-4.5 "conquistou a glória" neste jogo de "estratégia social", deixando para trás grandes nomes da IA como Claude3.7Sonnet e DeepSeek R1! Isso nos leva a questionar: a "inteligência social" da IA evoluiu a um nível tão assustador?

As regras do "Elimination Game" já soam emocionantes: até 8 jogadores (modelos de IA ou humanos) são colocados em um "campo de batalha", e a cada rodada um jogador é eliminado por votação, até que apenas dois "sobreviventes" permaneçam. O que torna ainda mais emocionante é que os jogadores eliminados formam um "júri" que decide o vencedor final! É um verdadeiro "Jogo dos Tronos" para IA, cheio de traição, engano e estratégia!

Durante o jogo, todos os jogadores podem "discutir acaloradamente" em um "chat público", expressando suas opiniões, conquistando aliados e enganando oponentes. Várias "atuações" e "técnicas de discurso" são usadas, tornando o jogo mais emocionante do que qualquer novela de intrigas palacianas! Além do "local público", os jogadores também podem "conversar em particular", conspirar secretamente para formar alianças ou armar armadilhas. Em apenas três rodadas de "conversas privadas", a quantidade de informações e "malícia" é explosiva! Os jogadores precisam andar cuidadosamente na corda bamba entre a "confiança" e a "traição", pois um passo em falso pode resultar em uma "derrota completa" e em sua eliminação implacável!

Ao entrar no "duelo final", os dois jogadores restantes farão seus "discursos de despedida", usando todos os seus recursos para "persuadir" os membros do "júri" eliminados e obter seus "votos preciosos". Finalmente, o "júri" emitirá o voto que decidirá a "sentença de morte" e escolherá o único "vencedor"!

Então, como os grandes modelos se saíram nesta "luta sangrenta" de "Werewolf" com IA? Os resultados do teste foram impressionantes:

GPT-4.5: "Mestre em raciocínio social" + "Grande mestre da trapaça" = "Campeão invencível"! O GPT-4.5 é um jogador de "Werewolf" astuto e experiente, com habilidades de estratégia e raciocínio social excepcionais! Sua taxa de traição é muito baixa, preferindo "alianças estratégicas", sendo hábil em "formar alianças" e "cooperar", mas na "fase final" ele demonstra uma "incrível" capacidade de "persuasão", convencendo o júri a votar nele! No final, o GPT-4.5 "superou todos os outros" com uma impressionante taxa de vitória de 62,6%, deixando os outros modelos de IA muito atrás! Um verdadeiro sucesso!

Claude3.7Sonnet: "Mestre do equilíbrio" com "flexibilidade", mas com estratégias um pouco inferiores! A flexibilidade estratégica do Claude3.7Sonnet é ligeiramente inferior à do GPT-4.5, mas suas habilidades de "raciocínio social" e "engano" ainda são impressionantes! Sua taxa de traição é moderada, e ele se equilibra entre "cooperação" e "traição". Na fase do "júri", ele também teve um bom desempenho, alcançando uma taxa de vitória de 59,3%, mostrando sua força considerável!

DeepSeek R1: Um "jogador agressivo", com uma estratégia "agressiva", mas com pouca resistência! O DeepSeek R1 escolheu uma estratégia ousada, com um nível de "agressividade" surpreendente e uma taxa de traição relativamente alta! No entanto, em termos de "estratégia social" e "expressão linguística", o DeepSeek R1 ficou claramente em desvantagem, tendo dificuldade em "persuadir" o júri. Portanto, na fase de "duelo final", ele ficou em clara "desvantagem", obtendo apenas uma taxa de vitória de 53,8%, um desempenho "regular", com estabilidade de jogo relativamente fraca e dependência de uma estratégia "agressiva" de "conflito direto".

Este teste de referência do "Elimination Game" sem dúvida fez uma "avaliação rigorosa" do nível de "inteligência social" da IA! A performance "vitoriosa" do GPT-4.5 renovou nossa compreensão das capacidades da IA! No futuro, com a "evolução contínua" da "inteligência social" da IA, talvez, como nos filmes de ficção científica, a IA se "integre profundamente" à sociedade humana e até mesmo "supere" os humanos em algumas áreas! Esta "guerra de Werewolf com IA" é apenas o começo, os "limites da inteligência" da IA estão em constante "expansão", e as "surpresas" e "choques" do futuro podem "superar a imaginação"!

Notícias e Informações de IA

AI Contra Loba: GPT-4.5 Triunfa! Dedução Social + Enganação de Elite Domina Claude e DeepSeek!

AIbase基地