Recientemente, investigadores han desarrollado un modelo de IA llamado DIAMOND (Diffusion for World Modelling) capaz de simular el famoso videojuego Counter-Strike: Global Offensive (CS:GO) dentro de una red neuronal.
Este modelo, ejecutado en una tarjeta gráfica Nvidia RTX3090, alcanza una velocidad de 10 fotogramas por segundo. Aunque el número de fotogramas no es alto, este logro es notable en el campo de la simulación de IA.
DIAMOND se entrenó con solo 87 horas de grabaciones de partidas de CS:GO, lo que representa apenas el 0.5% de los datos necesarios para proyectos similares como GameNGen. A pesar de la poca cantidad de datos, el modelo logra simular escenas del juego de forma impresionante.
DIAMOND inicialmente demostró su capacidad en juegos de Atari. Utiliza un método basado en Transformer, considerando los movimientos del jugador como "tokens", similares a las palabras en una oración. Al predecir estos tokens, el modelo aprende a anticipar los próximos movimientos del jugador basándose en acciones previas.
El investigador Eloi Alonso mostró las capacidades del modelo en Twitter. En el video se puede ver a un jugador interactuando con el entorno simulado de CS:GO mediante teclado y ratón. La simulación incluye elementos complejos como la interacción entre jugadores, la mecánica de las armas y los efectos físicos del entorno. Sin embargo, DIAMOND aún presenta algunas deficiencias evidentes.
Por ejemplo, el jugador puede saltar infinitamente, ya que el modelo no considera la gravedad ni la detección de colisiones del motor Source. Además, la simulación se bloquea por completo si el jugador se desvía de las rutas comúnmente utilizadas en los datos de entrenamiento.
Los investigadores creen que el rendimiento del modelo mejorará con el aumento de datos y capacidad de cálculo. También consideran que en el futuro será posible desarrollar modelos de IA capaces de navegar en entornos reales complejos.
Cabe mencionar que la simulación de CS:GO de DIAMOND se inspiró en el sistema GameNGen, desarrollado conjuntamente por Google Research, Google DeepMind y la Universidad de Tel Aviv, capaz de simular completamente una parte del juego clásico DOOM a 20 fotogramas por segundo en un solo chip Google TPU.
Para los desarrolladores interesados en IA, el modelo DIAMOND ya está disponible de código abierto en GitHub. ¡Los invitamos a explorarlo!
Enlace al proyecto: https://diamond-wm.github.io/
Puntos clave:
- 🎮 Los investigadores han desarrollado un modelo de IA, DIAMOND, capaz de simular CS:GO, funcionando en una Nvidia RTX3090 a 10 fotogramas por segundo.
- 📊 El modelo se entrenó con solo 87 horas de datos de juego, y a pesar de la poca cantidad de datos, simula escenas complejas del juego.
- 🐛 DIAMOND presenta limitaciones y errores importantes, pero los investigadores confían en que se mejorará su rendimiento con más datos y capacidad de cálculo.