模仿
在python / Tensorflow中实现选定的逆向强化学习(IRL)算法。
python demo.py
实现的算法
线性逆强化学习(Ng&Russell 2000)
最大熵逆强化学习(Ziebart et al。2008)
最大熵深度逆强化学习(Wulfmeier et al。2015)
已实施MDP和求解器
网格世界2D
网格世界1D
价值迭代
依存关系
python 2.7
cvxopt
Tensorflow 0.12.1
matplotlib
线性逆向强化学习
根据Ng和Russell 2000的论文:算法,算法1
$ python linear_irl_
1