搜索【DQN】的结果

深度强化学习——DQN

本文来自于csdn，本文章主要介绍了深度学习与强化学习结合起来从而实现从感知（Perception）到动作（Action）的端对端（End-to-end）学习的一种全新的算法。原因：在普通的Q-learning中，当状态和动作空间是离散且维数不高时可使用Q-Table储存每个状态动作对的Q值，而当状态和动作空间是高维连续时，使用Q-Table不现实。通常做法是把Q-Table的更新问题变成一个函数拟合问题，相近的状态得到相近的输出动作。如下式，通过更新参数θθ使Q函数逼近最优Q值而深度神经网络可以自动提取复杂特征，因此，面对高维且连续的状态使用深度神经网络最合适不过了。DRL是将深度学习（DL

2022-02-14 00:41:48 395KB 深度强化学习——DQN

1

RLlab:DQN，NAF，DDPG的pytorch实现-源码

实验室 RL算法的某些实现主要使用pytorch。目前已实施： DQN DDPG 资产净值优势演员克里蒂安装： git clone 跑步：安装后，只需运行main.py

2022-01-14 17:07:45 435KB Python

1

maze_dqn:使用深度强化学习（DQN）解决迷宫任务-源码

maze_dqn 使用深度强化学习（DQN）解决迷宫任务

2022-01-06 09:45:12 18KB

1

sfc-dqn:SFC-DQN的Tensorflow实现-源码

sfc-dqn 该存储库是软件驱动的5G Slice中基于纸质增强学习的基于QoS / QoE感知服务功能链的tensorflow实现。以下是文件简介： env.py：模拟SFC链分配的环境。 config.py：带宽，延迟和sfc请求的预设 dqn.py：DQN算法的核心代码。 train.py：运行此文件以单独训练DQN代理： python train.py 。它将从ckpt /加载检查点文件并继续训练，并自动将检查点保存在ckpt /中。注意：请改用main.py。 ckpt：用于存储预训练参数的文件夹。运行eval.py，main.py时需要。 eval.py：评估DQN的平均QoE和错误率，并随机生成100个sfc请求。尝试使用python eval.py查看平均QoE和错误率。如果通过cpu运行，则DQN的完整时间可能会更长。 random_sfc.

2021-12-21 17:39:24 1.46MB Python

1

第9课：强化学习与DQN.pdf

2021-12-15 18:11:33 5.97MB 机器学习

1

reinforcement_q_learning.py

关于强化学习dqn的相关代码，适合初学者认识和了解强化学习dqn

2021-12-14 18:30:34 19KB dqn

1

torchrl：强化学习算法的Pytorch实现（软演员评论员（SAC）DDPG TD3 DQN A2C PPO TRPO）-源码

火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境。支持具有1d和3d观察空间的环境。支持多进程环境要求一般要求火炬1.7 健身房（0.10.9） Mujoco（1.50.1）列表（用于日志） tensorboardX（日志文件输出）张量板要求 Tensorflow：启动tensorboard或读取tf记录中的日志安装使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求用法在配置文件中指定算法的参数，并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息目前包含：政策上的方法：加强 A2C（演员评论家） PPO（近端政策优化）

2021-11-23 11:43:20 170KB algorithm reinforcement-learning pytorch dqn

1

6.categorical dqn.ipynb

关于categorical dqn的例子，适合初学者对深度强化学习categorical dqn的认识和了解

2021-11-11 13:51:37 109KB categorical dqn

1

deep-q-learning：Keras中的最小深度Q学习（DQN和DDQN）实现-源码

深度学习通过深度强化学习制作简单的游戏AI简介 Keras和Gym中最小和简单的深度Q学习实现。不到100行代码！博客文章包含dqn.py代码的说明。为了方便起见，我对该存储库进行了一些细微的调整，例如load和save功能。我还使memory成为双端队列，而不只是列表。这是为了限制内存中元素的最大数量。训练对于dqn.py可能是不稳定的。 ddqn.py减轻了此问题。我将在下一篇文章中介绍ddqn 。

2021-11-05 16:01:18 154KB reinforcement-learning deep-learning deep-reinforcement-learning dqn

1

rainbow-is-all-you-need:彩虹就是您所需要的！从DQN到Rainbow的分步教程-源码

您是否希望RL代理商在Atari上继续前进？彩虹就是您所需要的！这是从DQN到Rainbow的分步教程。每章都包含理论背景和面向对象的实现。只需选择您感兴趣的任何主题，然后学习！您甚至可以在智能手机上使用Colab立即执行它们。如果您有任何改善建议，请随时提出问题或提出要求。 :) 如果您想要有关策略渐变方法的教程，请参阅。内容 DQN [ ] [ ] DoubleDQN [ ] [ ] PriorityizedExperienceReplay [ ] [ ] DuelingNet [ ] [ ] NoisyNet [ ] [ ] CategoricalDQN [ ] [ ] N-stepLearning [ NBViewer ] [ Colab ] 彩虹[ NBViewer ] [ Colab ] 先决条件此存储库已在Anac

2021-11-03 12:21:10 739KB reinforcement-learning rainbow pytorch dqn

1

个人信息

热门下载

最新下载

其他资源