Ada-IRL Adaboost逆向强化学习 一种使用类似于Adaboost的I-Rl算法的方法。 RL 开始进行强化学习的测试演示。 python rl_test.py 内部收益率 开始进行逆向强化学习的测试演示。 python irl_test.py
1
模仿学习基准实施 该项目旨在提供模仿学习算法的清晰实现。 目前,我们已经实现了行为克隆, (带有综合示例),和。 安装: 安装PyPI版本 pip install imitation 安装最新的提交 git clone http://github.com/HumanCompatibleAI/imitation cd imitation pip install -e . 可选的Mujoco依赖性: 请按照说明在安装 。 CLI快速入门: 我们提供了几个CLI脚本作为imitation实现的算法的前端。 这些使用进行配置和复制。 从examples / quickstart.sh中: # Train PPO agent on cartpole and collect expert demonstrations. Tensorboard logs saved in `quickstar
1
逆向强化学习 要求 Python 3.6+ 准备 要运行此代码,请通过pip安装numpy和Gym。 $ pip install numpy gym 克隆此存储库。 $ git clone https://github.com/yasufumy/python_irl.git 价值迭代 $ python value_iteration 最大熵逆强化学习 $ python main.py
2021-09-14 16:54:28 5KB python inverse-reinforcement-learning Python
1
逆强化学习配套专栏2-最大熵学习的会议论文-presentation的PPT,含paper的主要思想和公式
2021-09-01 14:13:16 180KB 人工智能 强化学习 信息熵
1
简单介绍IRL的理论,发表使用可以
2021-07-06 22:05:55 483KB 强化学习
1