模仿学习
该存储库提供了论文的Tensorflow实现。
您可以找到经过预训练的网络。 当前的存储库添加了Tensorflow培训代码。
本文中的设置只有几处更改:
我们训练的步数更少(我们执行190k步,本文执行450k步),但这是可配置的。
控制器的分支遵循训练数据的顺序。
我们对输出采用不同的权重超参数(转向,汽油,刹车,速度),因为本文中建议的超参数对我们不起作用。
设置
该存储库使用docker映像。 为了使用它,请安装 。 要生成图像,请使用:
docker build --build-arg base_image=tensorflow/tensorflow:1.12.0-gpu -t imit-learn .
如果仅需要CPU映像,请base_image=tensorflow/tensorflow:1.12.0-gpu 。 到目前为止,我们仅使用tensorf
1