【路径规划】基于强化学习Q-Learing实现栅格地图路径规划matlab源码.zip
2021-11-19 20:23:12 534KB 简介
1
基于神经网络的系统识别工具箱版本 2 NNSYSID 工具箱包含许多用于识别具有神经网络的非线性动态系统的工具。 提供了几种基于多层感知器网络的非线性模型结构,还有许多用于模型验证和模型结构选择的功能。 该工具箱需要 MATLAB 5.3 或更高版本。 工具箱随附手册(约 110 页,pdf 格式)。 更多信息可以在www.iau.dtu.dk/research/control/nnsysid.html
2021-11-19 17:26:42 710KB matlab
1
RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。 DDPG:深度确定性策略梯度和A3C:异步Actor-Critic代理 注意:环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°DDPG: 基于带有深度强化学习的持续控制: : 和来自精彩博客。 这种方法结合了DDQN算法(体验重播和目标网络)的优势以及可输出连续动作的行为者批评结构。 该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证,然后应用于定制的Envonement EnvPlant.py,模拟了温度模型: OU.py:探索是通过Ornstein-Uhlenbeck过程完成的,它具有便利的均值回复特性。 Models.py:演员,评论家和目标网络的神经网络 演员模型 批评模型 main.py:配置,训练,测试,显示,存储,加载 ReplayBuffer.py
2021-11-19 17:06:34 1.9MB Python
1
This introductory textbook on reinforcement learning is targeted toward engineers and scientists in artificial intelligence, operations research, neural networks, and control systems, and we hope it will also be of interest to psychologists and neuroscientists. 关于强化学习的一本原著,花钱在淘宝上买的。很值得一看的一本书~
2021-11-18 21:32:53 3.59MB Sutton Barto MIT Press
1
结合网上信息和莫烦视频做的一个分享,本想转化成博客但是一些动画我觉得还是必要的,有兴趣的可以一起交流
2021-11-18 09:31:22 29.43MB reinforcement learning Q-learning SARSA
1
建立了二自由度1/4汽车半主动悬架模型,在线性最优化理论的基础上设计出磁流变减振器半主动悬架的最优控制器,并在MAILAB/SIMULINK环境下进行仿真,结果表明采用最优控制器的流变减振器半主动悬架有效地改善了汽车行驶平顺性和乘坐舒适性。
2021-11-18 00:13:08 284KB 自然科学 论文
1
强化学习算法的实现 强化学习实例 在每个文件中,都有一个jupyter笔记本及其相应的python文件。 笔记本中记录了所有中间过程和绘图的位置,而在python文件中则是可以直接运行的已编译过程。 网格世界 井字游戏 Muilti-Arm强盗 二十一点 悬崖漫步 随机游走(n步TD法) 动态迷宫 DynaMaze实施 DynaMaze扩展实现 随机漫步(一般) 1000状态随机游走 平铺编码 平铺编码实现 山地车 策略功能近似 服务器访问 持续任务​​的概括 贝尔德计数器示例 非政策学习的普遍化 TD-Lambda 随机游走离线-Lambda 随机游走TD(\ lambda) 山车Lambda Sarsa-Lambda 策略近似 短走廊
2021-11-17 21:26:09 4.8MB JupyterNotebook
1
QlearningProject MatLab仿真,用于基于Q学习的避障和非周期性例程。 用于避障例程和移动机器人控制的Python代码。
2021-11-17 17:23:37 6.36MB python reinforcement-learning matlab q-learning
1
展示广告中通过强化学习进行的实时出价 这是实验代码的存储库,支持WSDM 2017中的“展示广告中的强化学习实时出价”一文。 小型评估演示 有关小规模评估的演示,请在脚本文件夹下运行: $ bash small-scale.sh 或在python文件夹下运行: $ python3 bid_ss.py 运行后,您可以在控制台中打印性能表,如下所示: setting objective auction impression click cost win-rate CPM eCPC ipinyou, camp=1458, algo=ss_mdp, N=1000, c0=0.03125 11 350000
2021-11-17 11:00:23 30.22MB Python
1
该书是美国杰出华人教授周克敏的专著,堪称是鲁棒控制领域的经典著作,书中既有易懂的理论推导,也结合了matlab/simulink 对一些例子进行了一些辅助设计。学习鲁棒控制与MATLAB的同学们一定不要错过。
1