梦想控制
注意:检出的代码,该代码同时支持Atari和DMControl环境。
在TensorFlow 2中快速简单地实现Dreamer代理。
如果您认为此代码有用,请在您的论文中参考:
@article{hafner2019dreamer,
title={Dream to Control: Learning Behaviors by Latent Imagination},
author={Hafner, Danijar and Lillicrap, Timothy and Ba, Jimmy and Norouzi, Mohammad},
journal={arXiv preprint arXiv:1912.01603},
year={2019}
}
方法
Dreamer学习了一个可以在紧凑的特征空间中进行预测的世界模型。从想象的特征序列中,它学习了策略和状态值功能
1