上传者: 38525735
|
上传时间: 2021-12-02 10:25:43
|
文件大小: 58KB
|
文件类型: -
捣迹线的matlab代码双Q学习的均方误差
这是
Neurips
2020
论文“双
Q
学习的均方误差”的复制代码
我们针对不同的环境测试了
Double
Q-learning
和
Q-learning。
以下所有实验均使用
Matlab
R2018b
和
Python
3.6.9
运行
我们考虑的环境
贝尔德的例子:贝尔德
GridWorld:网格
CartPole:手推车
最大化偏差:偏差,偏差(nn)
贝尔德的实验
文件:
bairds/GenBaird.m
bairds/simulation_baird.m
bairds/plot.py
在simulation_baird.m中,改变输入到函数GenBaird来模拟不同的设置
运行simulation_baird.m,它会生成几个文件,含义与后面指定的GridWorld相同。
绘制均方误差的轨迹:python3
plot.py
网格世界实验
文件:
网格/GenGrid.m
网格/simulation_grid.m
网格/plot.py
在simulation_grid.m中,改变输入到函数GenGrid来模拟不同大小的Gri