Windows Agent Arena (WAA) est un framework open source et extensible, axé sur le système d'exploitation Windows, conçu pour tester et développer des agents IA capables de raisonner, de planifier et d'agir sur un PC à l'aide de modèles linguistiques. En simulant un environnement Windows réel, il permet aux agents d'interagir librement et de résoudre des tâches en utilisant les mêmes applications, outils et navigateurs web que les utilisateurs humains. Grâce à Azure, WAA offre une extensibilité et une parallélisation permettant de réaliser des évaluations de benchmark complètes en seulement 20 minutes.