DIAMOND
Agent d'apprentissage par renforcement entraîné sur un modèle de diffusion du monde
Produit OrdinaireProductivitéMachine LearningApprentissage par renforcement
DIAMOND (DIffusion As a Model Of eNvironment Dreams) est un agent d'apprentissage par renforcement entraîné sur un modèle de diffusion du monde, conçu pour la modélisation du monde dans les jeux Atari où les détails visuels sont cruciaux. Il est entraîné sur un sous-ensemble de jeux Atari à l'aide d'une imagination autorégressive et permet une installation rapide et l'expérimentation de modèles de monde pré-entraînés.
DIAMOND Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34