Factorio Learning Environment (FLE) es un nuevo marco basado en el juego Factorio que se utiliza para evaluar la capacidad de los modelos de lenguaje de gran tamaño (LLM) en planificación a largo plazo, síntesis de programas y optimización de recursos. A medida que los LLM saturan gradualmente las pruebas de referencia existentes, FLE proporciona una nueva forma de evaluación abierta. Su importancia radica en que permite a los investigadores comprender de forma más completa y profunda las ventajas y desventajas de los LLM. Las principales ventajas son los desafíos abiertos con dificultad exponencialmente creciente, y dos protocolos de evaluación: tareas estructuradas y tareas abiertas. Este proyecto fue desarrollado por Jack Hopkins y otros, se publica en código abierto, es de uso gratuito y tiene como objetivo impulsar la investigación de los investigadores de IA sobre la capacidad de los agentes en campos complejos y abiertos.