PokéLLMon es el primer agente impulsado por LLM en lograr un rendimiento a nivel humano en juegos de combate táctico. Integra tres estrategias clave: 1) Aprendizaje por refuerzo contextual, que utiliza iterativamente la retroalimentación de descripciones textuales extraídas de la batalla para optimizar su estrategia de generación; 2) Generación mejorada por conocimiento, que aprovecha el conocimiento externo para contrarrestar las alucinaciones y permitir que el agente actúe de manera oportuna y precisa; 3) Generación de acciones autoconsistente, para mitigar los cambios repentinos de estrategia cuando el agente se enfrenta a oponentes poderosos y desea evitar la batalla. Las batallas en línea contra jugadores humanos demostraron el rendimiento y las estrategias de combate de nivel humano de PokéLLMon, alcanzando una tasa de victorias del 49% en torneos clasificatorios y del 56% en torneos por invitación. Además, hemos revelado su vulnerabilidad a las estrategias de desgaste y las tácticas engañosas de los jugadores humanos.