PokéLLMon ist der erste LLM-basierte Agent, der in taktischen Kampfspielen menschenähnliche Leistung erzielt. Er integriert drei Schlüsselstrategien: 1) kontextbasiertes Verstärkungslernen, das iterativ seine generierten Strategien optimiert, indem es unmittelbar Feedback aus textbasierten Kampfbeschreibungen nutzt; 2) wissensgestützte Generierung, die mithilfe von externem Wissen gegen Halluzinationen vorgeht und so zeitnahe und korrekte Aktionen ermöglicht; 3) selbstkonsistente Aktionsgenerierung, um Panikreaktionen bei starken Gegnern und dem Wunsch, den Kampf zu vermeiden, zu reduzieren. Online-Duelle gegen menschliche Spieler demonstrieren PokéLLMons menschenähnliche Kampfperformance und Strategien, mit einer Gewinnrate von 49 % in Ranglistenspielen und 56 % in Einladungsturnieren. Darüber hinaus zeigen wir seine Anfälligkeit gegenüber Ausdauerstrategien und Täuschungsmanövern menschlicher Spieler.