上传者: 42128963
|
上传时间: 2021-10-28 09:30:51
|
文件大小: 19.97MB
|
文件类型: -
DQN-雅达利
深度Q网络实现。 实施从论文《和得出。
结果
游戏视频-DQN Nature Paper
每集奖励
实施摘要
DQN自然架构实施
输入:84×84×4图像(使用历史记录的最后4帧)
转换层1:32个8×8滤光片,步幅为4
转换层2:64个4×4步幅的滤镜
转换层3:64个3×3滤光片,步幅为1
完全连接1:完全连接,由256个整流器单元组成
输出:完全连接的线性层,每个有效动作均具有单个输出。
DQN Neurips架构实施
输入:84×84×4图像(使用历史记录的最后4帧)
转换层1:16个8×8滤光片,步幅为4
转换层2:32个4×4步幅的滤镜
完全连接1:完全连接,由256个整流器单元组成
输出:完全连接的线性层,每个有效动作均具有单个输出。
其他参数
优化器:RMSProp
批量大小:32
电子贪婪:0.1
怎么跑
创建一个新环境
例子:
conda