掌握离散世界模型的Atari
在TensorFlow 2中实现代理。包括所有55个游戏的训练曲线。
如果您认为此代码有用,请在您的论文中参考:
@article{hafner2020dreamerv2,
title={Mastering Atari with Discrete World Models},
author={Hafner, Danijar and Lillicrap, Timothy and Norouzi, Mohammad and Ba, Jimmy},
journal={arXiv preprint arXiv:2010.02193},
year={2020}
}
方法
DreamerV2是第一个在Atari基准上达到人类水平性能的世界模型代理。使用相同的经验和计算量,DreamerV2的性能也优于顶级无模型代理Rainbow和IQN。此存储库中的实现
1