mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制

上传者: 42168830 | 上传时间: 2022-04-20 11:15:37 | 文件大小: 172KB | 文件类型: ZIP
概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mbpo.py --env_name'Walker2d-v2'--num_epoch 300 --model_type'pytorch' python main_mbpo.py --env_name'Hopper-v2'--num_epoch 300 --model_type'pytorch' 参考

文件下载

资源详情

[{"title":"( 25 个子文件 172KB ) mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制","children":[{"title":"mbpo_pytorch-main","children":[{"title":"make_plot.py <span style='color:#111;'> 859B </span>","children":null,"spread":false},{"title":"results","children":[{"title":"walker2d.png <span style='color:#111;'> 71.16KB </span>","children":null,"spread":false},{"title":"hopper.png <span style='color:#111;'> 70.56KB </span>","children":null,"spread":false}],"spread":true},{"title":"__init__.py <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"predict_env.py <span style='color:#111;'> 4.28KB </span>","children":null,"spread":false},{"title":"sac","children":[{"title":"main.py <span style='color:#111;'> 5.97KB </span>","children":null,"spread":false},{"title":"utils.py <span style='color:#111;'> 965B </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"__init__.py <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"model.py <span style='color:#111;'> 4.97KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 3.31KB </span>","children":null,"spread":false},{"title":"sac.py <span style='color:#111;'> 5.91KB </span>","children":null,"spread":false},{"title":"replay_memory.py <span style='color:#111;'> 1.84KB </span>","children":null,"spread":false}],"spread":true},{"title":"model.py <span style='color:#111;'> 16.01KB </span>","children":null,"spread":false},{"title":".gitignore <span style='color:#111;'> 25B </span>","children":null,"spread":false},{"title":"sample_env.py <span style='color:#111;'> 1.02KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 1.23KB </span>","children":null,"spread":false},{"title":"main_mbpo.py <span style='color:#111;'> 14.86KB </span>","children":null,"spread":false},{"title":"tf_models","children":[{"title":"utils.py <span style='color:#111;'> 2.96KB </span>","children":null,"spread":false},{"title":"fake_env.py <span style='color:#111;'> 4.06KB </span>","children":null,"spread":false},{"title":"tf_logging.py <span style='color:#111;'> 4.01KB </span>","children":null,"spread":false},{"title":"__init__.py <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"bnn.py <span style='color:#111;'> 26.06KB </span>","children":null,"spread":false},{"title":"fc.py <span style='color:#111;'> 9.36KB </span>","children":null,"spread":false},{"title":"constructor.py <span style='color:#111;'> 3.31KB </span>","children":null,"spread":false}],"spread":true}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明