prob_mbrl
基于概率模型的RL的Deep-PILCO及其变体的实现。 这是算法的(正在进行中)重新实现。 我们还旨在将其他基于概率模型的RL方法添加到该库中。
推荐的安装方式:
安装Miniconda 3发行版: ://conda.io/miniconda.html
conda install pytorch cuda90 cudnn -c pytorch
conda install tqdm
要运行mc-pilco cartpole示例,您还需要安装kusanagi库( )。 我们计划在将来消除这种依赖性。
例如,有关如何使用此库的信息,请查看notbooks文件夹。 目前,我们有一个使用BNN模型进行回归的示例,还有一个MC PILCO的示例
1