This repository contains most of classic deep reinforcement learning algorithms, including - DQN, DDPG, A3C, PPO, TRPO. (More algorithms are still in progress)
2021-09-24 19:57:52 3.79MB Python开发-机器学习
1
多用户移动边缘计算的分散式计算分流:一种深度强化学习方法 多用户移动边缘计算的分散式计算分流:一种深度强化学习方法 这实现了论文中的算法 一些提示:尝试通过运行ipynb文件之一来开始您的旅程,例如test_save_model_multiple_t02_noBuf.ipynb。 “用于多用户移动边缘计算的分散式计算分流:一种深度强化学习方法” 如果您发现这对您的研究有用,请使用 @article {chen2018decentralized,title = {用于多用户移动边缘计算的分散式计算分流:一种深度强化学习方法},作者= {Chen,Zhao和Wang,Xiaodong},journal = {arXiv预印本arXiv:1812.07394},年= {2018}} 如有任何疑问,请通过与我联系。
2021-09-24 16:46:28 444.79MB JupyterNotebook
1
Survey_of_Deep_Metric_Learning:深度度量学习和相关作品的全面调查
2021-09-24 14:30:18 102KB deep-learning tensorflow pytorch metric-learning
1
研究了基于深度强化学习算法的自主式水下航行器(AUV)深度控制问题。区别于传统的控制算法,深度强化学习方法让航行器自主学习控制律,避免人工建立精确模型和设计控制律。采用深度确定性策略梯度方法设计了actor与critic两种神经网络。actor神经网络给出控制策略,critic神经网络用于评估该策略,AUV的深度控制可以通过训练这两个神经网络实现。在OpenAI Gym平台上仿真验证了算法的有效性。
1
分布式DRL 分布式深度强化学习 该框架的灵感来自OpenAI的通用RL培训系统Rapid 。 快速框架: 我们的框架: 教程 该框架将强化学习过程分为五个部分: 重播缓冲区(选项) 参数服务器 火车(学习) 推出 测试 @ ray . remote class ReplayBuffer : ... # replay buffer @ ray . remote class ParameterServer ( object ): ... # keep the newest network weights here # could pull and push the weights # also could save the weights to local @ ray . remote ( num_gpus = 1 ,
2021-09-18 15:12:57 874KB Python
1
学习+彭伟《揭秘深度强化学习》PDF+源代码+资料-附件资源
2021-09-17 17:00:05 23B
1
TensorFlow2中的深度强化学习 是一个使用实现各种流行的深度强化学习算法的存储库。 该存储库的关键是易于理解的代码。 因此,如果您是学生或研究深度强化学习的研究人员,我认为这是使用此存储库学习的最佳选择。 一种算法仅依赖于一个python脚本文件。 因此,您不必进出不同的文件即可研究特定的算法。 该存储库将不断更新,并将继续添加新的“深度强化学习”算法。 演算法 DQN 纸上 作者Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex Graves,Ioannis Antonoglou,Daan Wierstra,Martin Rie
1
拨盘 分布式资源分配与Multi-Agent的深强化学习的5G-V2V通信 。 此存储库包含玩具示例的源代码,我们在本文中使用了该示例来测试算法的性能。 抽象的 我们考虑在没有基站的情况下在车对车(V2V)通信中的分布式资源选择问题。 每辆车从共享资源池中自主选择传输资源,以传播合作意识消息(CAM)。 这是每个车辆必须选择唯一资源的共识问题。 当由于移动性而彼此相邻的车辆数量在动态变化时,这个问题变得更具挑战性。 在拥挤的情况下,为每辆车分配唯一资源变得不可行,并且必须开发拥挤的资源分配策略。 5G中的标准化方法,即半永久性调度(SPS)受车辆空间分布造成的影响。 在我们的方法中,我们将其转化为优势。 我们提出了一种使用多主体强化学习(DIRAL)的新颖的DIstributed资源分配机制,该机制建立在唯一的状态表示之上。 一个具有挑战性的问题是应对并发学习代理引入的非平稳性,这会导致多
2021-09-13 11:37:09 8.63MB Python
1
行业-电子政务-基于深度Q学习的低压电器卡合装配技术研究.zip
2021-09-11 09:01:57 13.98MB 行业-电子政务-基于深度Q学习的
鉴于深度强化学习(DRL)在推荐系统研究中的出现,以及近年来取得的丰硕成果,本研究旨在对深度强化学习在推荐系统中的最新发展趋势提供一个及时而全面的概述。我们从在推荐系统中应用DRL的动机开始。
2021-09-10 09:10:34 1.42MB 深度强化学习
1