DIAMOND
拡散ワールドモデルで訓練された強化学習エージェント
一般製品生産性機械学習強化学習
DIAMOND(DIffusion As a Model Of eNvironment Dreams)は、アータリゲームにおける視覚的な詳細が非常に重要なワールドモデリングのために、拡散ワールドモデルで訓練された強化学習エージェントです。自己回帰的想像を用いてアータリゲームのサブセットで訓練されており、事前訓練済みのワールドモデルを迅速にインストールして試すことができます。
DIAMOND 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34