prob_mbrl 基于概率模型的RL的Deep-PILCO及其变体的实现。 这是算法的(正在进行中)重新实现。 我们还旨在将其他基于概率模型的RL方法添加到该库中。 推荐的安装方式: 安装Miniconda 3发行版: ://conda.io/miniconda.html conda install pytorch cuda90 cudnn -c pytorch conda install tqdm 要运行mc-pilco cartpole示例,您还需要安装kusanagi库( )。 我们计划在将来消除这种依赖性。 例如,有关如何使用此库的信息,请查看notbooks文件夹。 目前,我们有一个使用BNN模型进行回归的示例,还有一个MC PILCO的示例
2021-08-27 16:03:06 905KB JupyterNotebook
1
2020年nips model-based reinforcement learning相关论文集合
2021-08-03 17:09:56 17.32MB RL MBRL model-based 强化学习论文
1