深度强化学习代码 当前,这里只有用于分布增强学习的代码。 C51,QR-DQN和IQN的代码与略有。 QUOTA是基于算法作者同的工作而实现的。 我最近注意到,我的DQN代码可能无法获得理想的性能,而其他代码却运行良好。 如果有人可以指出我的代码中的错误,我将不胜感激。 随时进行聊天-如果您想讨论任何事情,请给我发送电子邮件。 依赖关系: pytorch(> = 1.0.0) 体育馆(= 0.10.9) 麻木 matplotlib 用法: 为了运行我的代码,您需要在主目录下创建两个子目录:./data/model/&./data/plots/。 这两个目录用于存储数据。 当计算机的python环境满足上述依赖性时,您可以运行代码。 例如,输入: python 3_ iqn . py Breakout 在命令行上运行以在Atari环境中运行算法。 您可以为代码内的算法更改一些特定参数。 训练后,您可以通过使用适当的参数运行result_show.py来绘制结果。 参考文献: 通过深度强化学习(DQN)进行人为控制[] [] 强化学习的分布式视角(C51)[] []
1
1.前言 循环神经网络让神经网络有了记忆, 对于序列型的数据,循环神经网络能达到更好的效果.接着我将实战分析手写数字的 RNN分类 2.导入模块、定义超参数 import torch from torch import nn import numpy as np import matplotlib.pyplot as plt torch.manual_seed(1) TIME_STEP = 10 INPUT_SIZE = 1 LR = 0.02 3.数据准备且打印拟合目标 我们要用到的数据就是这样的一些数据, 用 sin 的曲线预测出 cos 的曲线,也即用sin拟合cos steps =
2021-10-23 16:34:28 297KB 回归 学习 实战
1
StSpark.zip
2021-10-19 09:03:04 195.06MB 学习代码
1
深度学习代码 这是我练习过的所有深度学习代码
2021-10-16 09:31:47 7.91MB JupyterNotebook
1
代码直接用 改输入输出就行WOA-ELMAN
2021-10-14 16:08:35 6KB matlab 机器学习
IO流学习代码,包括了作业3的内容
2021-10-09 18:02:51 39KB java
1
角点检测代码matlab
2021-10-06 11:04:12 3.94MB 系统开源
1
主动学习 以下两篇论文中成对约束和相对比较的主动学习代码: Sicheng Xiong、Javad Azimi 和 Xiaoli Z. Fern。 半监督聚类约束的主动学习,IEEE Transactions on Knowledge on Data Engineering 26(1): 43-54 (2014) Sicheng Xiong、Romer Rosales、Yuanli Pei 和 Xiaoli Z. Fern。 从相对比较中学习主动度量,arXiv:1409.4155 (2014)
2021-10-02 15:36:42 142KB MATLAB
1