详细分析莫烦DQN代码
Python入门,莫烦是很好的选择,快去b站搜视频吧!
作为一只渣渣白,去看了莫烦的强化学习入门, 现在来回忆总结下DQN,作为笔记记录下来。
主要是对代码做了详细注释
DQN有两个网络,一个eval网络,一个target网络,两个网络结构相同,只是target网络的参数在一段时间后会被eval网络更新。
maze_env.py是环境文件,建立的是一个陷阱游戏的环境,就不用细分析了。
RL_brain.py是建立网络结构的文件:
在类DeepQNetwork中,有五个函数:
n_actions 是动作空间数,环境中上下左右所以是4,n_features是状态特征数,根据
1