MLGym es un marco y punto de referencia de código abierto desarrollado por el equipo GenAI de Meta y el equipo UCSB NLP para entrenar y evaluar agentes de investigación de IA. Impulsa el desarrollo de algoritmos de aprendizaje por refuerzo al proporcionar diversas tareas de investigación de IA, ayudando a los investigadores a entrenar y evaluar modelos en escenarios de investigación del mundo real. El marco admite diversas tareas, incluyendo los campos de visión por computadora, procesamiento del lenguaje natural y aprendizaje por refuerzo, con el objetivo de proporcionar una plataforma de prueba estandarizada para la investigación en IA.