DIAMOND
Agente de aprendizaje por refuerzo entrenado en un modelo de mundo de difusión.
Producto ComúnProductividadAprendizaje automáticoAprendizaje por refuerzo
DIAMOND (DIffusion As a Model Of eNvironment Dreams) es un agente de aprendizaje por refuerzo entrenado en un modelo de mundo de difusión, utilizado para el modelado de mundos en juegos Atari donde los detalles visuales son cruciales. Se entrena mediante imaginación autorregresiva en un subconjunto de juegos Atari, permitiendo una rápida instalación y prueba del modelo de mundo preentrenado.
DIAMOND Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34