O PokéLLMon é o primeiro agente baseado em LLM a alcançar desempenho de nível humano em jogos de batalha tática. Ele integra três estratégias-chave: 1) Aprendizado por reforço baseado em contexto, otimizando iterativamente sua estratégia de geração usando feedback de descrições de texto extraídas das batalhas em tempo real; 2) Geração aprimorada por conhecimento, usando conhecimento externo para combater alucinações e permitir que o agente aja de forma oportuna e correta; 3) Geração de ações autoconsistente, mitigando o comportamento de mudança de estratégia precipitada quando o agente enfrenta oponentes fortes e pretende evitar a batalha. Partidas online contra jogadores humanos demonstraram o desempenho e a estratégia de nível humano do PokéLLMon, alcançando uma taxa de vitória de 49% em partidas classificatórias e 56% em torneios. Além disso, revelamos sua vulnerabilidade a estratégias de desgaste e truques enganosos por parte dos jogadores humanos.