本文研究并借鉴了深度 Q 网络的结构,借鉴其使用一个神经网络处理图像输入并计算行动价值函数,将深度学习与增强学习结合。根据路径规划问题的特殊性设计了一个全卷积神经网络,并引入注意力机制优化网络结构。其次,针对神经网络在处理多步决策、规划问题上的短板,参考价值迭代网络,在神经网络模型的基础上引入价值迭代模块。对价值迭代模块进行解构分析,提出改进的价值迭代模块,解决了引入价值迭代模块造成的误差累积问题。最后,将神经网络表征的行动价值函数分解为状态价值函数与优势函数之和,形成竞争神经网络结构,至此完成神经网络的构建。本文使用 2D 栅格环境,使用专家样本取代传统增强学习中的代理经历,以模仿学习方式加速模型训练。通过算法在最短路径规划问题上的表现衡量算法效能。
动态路由 项目描述: 为了测试动态网络上各种路由算法的性能,我们在网络上创建了一个数据包路由仿真,该仿真在一系列时间步长上进行离散更新。 在整个仿真过程中,随机选择边缘以消失并在每个时间步进行恢复。 另外,在整个情节中,边缘权重以正弦形式波动。 在每个情节的开始,网络上都会生成许多数据包(网络负载),每个数据包都有一个随机的起始节点和目标节点。 每次传送数据包时,都会在一些时间步长后初始化一个新数据包。 一旦生成了一定数量的数据包并在网络上传递,该情节就结束了。 然后计算平均分组传送时间和各种网络拥塞度量。 该模拟要求路由器根据一种路由算法为每个数据包确定路径。 特别是对于这个项目,我们探索通过Dijkstra算法的最短路径,通过Floyd-Warshall算法的最短路径,通过各种奖励函数的Q学习,以及Deep Q Learning。 要求: 网络X FFmpeg(用于动画制作)
2021-03-08 09:50:58 42KB Python
1
协作学习无线电网络中的抗干扰增强学习功率控制
2021-03-03 10:05:54 916KB 研究论文
1
基于案例推理增强学习的磨矿过程设定值优化
2021-02-08 10:04:00 5.87MB 研究论文
1
深度增强学习算法的PyTorch实现(策略梯度/生成对抗模仿学习)
2020-04-13 03:17:09 5.41MB Python开发-机器学习
1
该框架利用多核CPU处理能力,用于训练和评估增强学习Agent。Coach包含一些领先的增强学习算法的多线程实现,适用于各种游戏和机器人环境。它能够在台式计算机上高效地训练强化学习Agent,而无需任何额外的硬件。
2020-01-10 03:12:57 41.85MB Python开发-机器学习
1
从各种网站在下载到的Q学习算法集成包,有matlab示例,有C示例,有Java示例,有C++示例。总有一个算法是你需要模拟和借鉴的,需要研究强化学习或增强学习算法的人不容错过。。。真心话,要不是我需要下载别的资源需要积分,不会无私奉献。。。我的强化学习就是在这里面修改实现的,需要的顶起来。。
2019-12-21 21:13:00 260KB Q学习 强化学习 增强学习 DynaQ
1
莫烦大大的增强学习的代码实例````
2019-12-21 21:01:08 259KB 增强学习
1
Reinforcement Learning: An Introduction最新版习题解答
2019-12-21 20:14:50 265KB 增强学习
1
2018版《增强学习导论》,著名增强学习大师 Richard S. Sutton 教授的经典教材《增强学习导论》(Reinforcement Learning: An Introduction)
2019-12-21 19:29:52 18.44MB 强化学习
1