搜索【DQN】的结果

DeepReinforcementLearning：深度RL实施。在pytorch中实现的DQN，SAC，DDPG，TD3，PPO和VPG。经过测试的环境：LunarLander-v2和Pendulum-v0-源码

使用Pytorch实现的深度RL算法算法列表：关于深入探讨实验结果：算法离散环境：LunarLander-v2 连续环境：Pendulum-v0 DQN -- VPG -- DDPG -- TD3 -- SAC -- PPO -- 用法：只需直接运行文件/算法。在我学习算法时，它们之间没有通用的结构。不同的算法来自不同的来源。资源：未来的项目：如果有时间，我将为使用RL的电梯添加一个简单的程序。更好的图形

2021-04-26 01:35:45 391KB algorithms ddpg sac ppo

1

强化学习入门必读论文（DQN相关）

整理了强化学习入门时必看的论文，主要是有关DQN算法的，致力于强化学习的小伙伴应该必看这些论文的

2021-04-19 15:19:45 13.72MB 强化学习

1

基于DQN的车载边缘网络任务分发卸载算法

为实现车辆终端用户任务执行时延与处理速率、能耗的最佳均衡关系，针对车联网的边缘接入环境，提出了一种基于深度 Q 网络（DQN）的计算任务分发卸载算法。首先根据层次分析法对不同车辆终端的计算任务进行优先级划分，从而为计算任务处理速率赋予不同的权重建立关系模型；然后引入基于深度Q网络的边缘计算方法，以计算任务处理速率加权和为优化目标建立任务卸载模型；最后建立基于 DQN 的车辆终端自主最优任务卸载策略，最大化卸载决策制定模型的长期效用。仿真结果表明，相比Q学习算法，所提算法有效提高了任务执行效率。

2021-04-14 20:33:15 793KB 车联网 移动边缘计算 计算卸载 深度Q网络 计算速率

1

Missile-control-with-DQN-源码

海防环境的导弹目标选择任务流程介绍：敌方舰艇以固定阵型排列，我方18枚导弹依次选择攻击目标并以直线轨迹攻击，攻击过程中若进入防御舰艇的防御长度内则有一定几率被拦截，舰艇被攻击一定次数后死亡，同样的，可以根据任务需求，通过改变不同类型的舰艇艇的价值来调整导弹攻击的侧重点，综上，需要合理选择攻击目标和攻击并以预期的伤害最大化状态空间定义为18个导弹的目标选择，初始化为[-1] * 18，每进行一个步骤填进去一个动作（攻击目标）动作空间定义为可以选择的舰艇数量，如果有7个舰艇则动作空格〜[0，6]，只能取整数固定阵型默认类型，如下所示，可在配置文件夹中设计新的阵型导弹双重两种攻击方式：位置攻击：18个导弹排成两排，位置固定，按照编号顺序选择攻击目标角度攻击：每个导弹首先选择攻击目标，然后根据角度偏向确定自己的发射位置文件：train.py：训练文件，负责训练DQN生成指定环境指定

2021-04-11 17:04:42 80.67MB Python

1

DQN-using-PyTorch和ML-Agents：如何使用PyTorch和ML-Agents环境实现基于矢量的DQN的简单示例-源码

使用PyTorch和Unity ML-Agent进行深度Q网络（DQN）强化学习一个简单的示例，说明如何使用PyTorch和ML-Agents环境实现基于矢量的DQN。深度强化学习（DRL）中的Udacity Danaodgree项目该存储库包含以下与DQN相关的文件： dqn_agent.py-> dqn-agent实现 replay_memory.py-> dqn-agent的重播缓冲区实现 model.py->用于基于向量的DQN学习的示例PyTorch神经网络 train.py->初始化并实施DQN代理的训练过程。 test.py->测试受过训练的DQN代理根据Udacit

2021-04-10 16:10:27 2.72MB reinforcement-learning unity deep-reinforcement-learning pytorch

1

deep-reinforcement-learning-atari-pong:强化学习DQN算法的PyTorch在OpenAI Atari Pong游戏中的应用-源码

Atari Pong中的深度强化学习算法概括此应用程序的目标是找出深度Q学习（DQN）在OpenAI环境中对Pong的Atari 1600游戏有多准确和有效。在DQN之上，测试了对相同算法的其他改进，包括多步DQN，Double DQN和Dueling DQN。从下图可以看出，基本DQN仅需玩约110场游戏即可达到类似于人的准确性，而经过300场游戏即可达到极高的准确性。此项目中考虑的DQN改进版本显示出效率和准确性方面的一些改进。基本DQN：第1集与第216集环保环境 Atari 1600仿真器由OpenAI制作，您可以在59种不同的游戏上测试您的强化算法。使用深度强化学习，因为输入是当前帧（210x160x3）的RGB图片。由于RGB图片的计算量太大，因此变成了灰度。接下来是将图像缩减采样并将其剪切到可播放区域，该区域的大小为84x84x1。灰度，下采样和裁剪

2021-03-27 20:32:26 1.3MB Python

1

DQN最短路径MATLAB.zip

不用强化学习工具箱的DQN算法案例与matlab代码，方便大家学习使用。可以在此基础上直接更改编写自己的项目

2021-03-18 22:17:25 872KB DQN

1

DQN+PyTorch+gym倒立摆登山车源码&模型

DQN+PyTorch+gym倒立摆登山车源码&模型，博文https://blog.csdn.net/qq_33309098/article/details/104588035

2021-03-17 14:51:01 1.86MB 强化学习 pytorch

1

DQN_point_game.rar

强化学习算法DQN玩五子棋

2021-03-14 18:11:46 4.1MB AI 强化学习 DQN 玩五子棋

1

个人信息

热门下载

最新下载

其他资源