Reinforcement Learning implementations and research prototyping in TensorFlow
2021-09-14 19:33:33 128KB Python开发-机器学习
1
【lsp预测】基于粒子群优化强化学习预测matlab源码.md
2021-09-14 19:26:32 21KB 算法 源码
1
逆向强化学习 要求 Python 3.6+ 准备 要运行此代码,请通过pip安装numpy和Gym。 $ pip install numpy gym 克隆此存储库。 $ git clone https://github.com/yasufumy/python_irl.git 价值迭代 $ python value_iteration 最大熵逆强化学习 $ python main.py
2021-09-14 16:54:28 5KB python inverse-reinforcement-learning Python
1
Algorithms for Reinforcement Learning 强化学习的简单英文介绍
2021-09-14 15:50:37 1.59MB 强化学习
1
主要介绍强化学习里面的一些重要概念和基本内容,PPT,总结的还不错,可以参考
2021-09-14 14:29:47 3.76MB 强化学习 深度学习 人工智能
1
关于强化学习的讲解,以PPT的形式出现非常条理化,是了解强化学习的好资料。
2021-09-14 14:24:16 1001KB 强化学习 人工智能
1
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 [1] 。 强化学习的常见模型是标准的马尔可夫决策过程(Markov Decision Process, MDP)。按给定条件,强化学习可分为基于模式的强化学习(model-based RL)和无模式强化学习(model-free RL) [1] ,以及主动强化学习(active RL)和被动强化学习(passive RL) [2] 。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数(value function)算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习 [1] 。 强化学习理论受到行为主义心理学启发,侧重在线学习并试图在探索-利用(exploration-exploitation)间保持平衡。不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数 [3] 。
2021-09-14 11:32:23 2.74MB 强化学习 机器学习
1
强化学习 深度学习:优化 创建人:Vithurshan Vijayachandran和Hisho Rajanathan RLearning_NOTEBOOK.ipynb-适用于基本(Q学习)和高级任务(DQN和DDQN)的Jupyter笔记本。 RL_Rport.pdf:报告所有研究结果和评估。 使用以下预训练模型来测试网络,因为重新训练非常耗时。 DQNTrainingModel.h5-测试DQN网络所需的文件 DDQNTrainingModel.h5-测试DDQN网络所需的文件 DDQNPERTrainingModel.h5 =使用PER网络测试DDQN所需的文件
2021-09-14 10:57:27 2.5MB JupyterNotebook
1
拨盘 分布式资源分配与Multi-Agent的深强化学习的5G-V2V通信 。 此存储库包含玩具示例的源代码,我们在本文中使用了该示例来测试算法的性能。 抽象的 我们考虑在没有基站的情况下在车对车(V2V)通信中的分布式资源选择问题。 每辆车从共享资源池中自主选择传输资源,以传播合作意识消息(CAM)。 这是每个车辆必须选择唯一资源的共识问题。 当由于移动性而彼此相邻的车辆数量在动态变化时,这个问题变得更具挑战性。 在拥挤的情况下,为每辆车分配唯一资源变得不可行,并且必须开发拥挤的资源分配策略。 5G中的标准化方法,即半永久性调度(SPS)受车辆空间分布造成的影响。 在我们的方法中,我们将其转化为优势。 我们提出了一种使用多主体强化学习(DIRAL)的新颖的DIstributed资源分配机制,该机制建立在唯一的状态表示之上。 一个具有挑战性的问题是应对并发学习代理引入的非平稳性,这会导致多
2021-09-13 11:37:09 8.63MB Python
1
强化模型算法,多Agent协作的强化学习模型和算法
2021-09-12 21:34:59 272KB agent
1