Los investigadores de DeepMind han presentado AlphaStar Unplugged, resolviendo con éxito el desafío de StarCraft II mediante la implementación del aprendizaje por refuerzo fuera de línea (offline reinforcement learning). Al establecer un punto de referencia para el RL fuera de línea, han demostrado el potencial del aprendizaje por refuerzo fuera de línea a gran escala y han proporcionado un método más práctico para entrenar agentes en entornos complejos. Este logro promete impulsar un mayor progreso en la investigación del aprendizaje por refuerzo fuera de línea.