matlab代码注释标准直升机RL 该代码是我的硕士项目“自主直升机控制强化学习”的一部分。 有关项目的完整说明,请访问网站 该项目是由伦敦帝国学院统计机器学习小组在马克·迪森罗特(Marc Deisenroth)的监督下完成的。 依存关系 皮尔科: 纸: 代码: RL-Glue Core和Matlab编解码器: 纸: 代码: 标准Matlab安装,Java和Java编译器 安装说明 按照RL-Glue和RL-Library网站上的说明下载PILCO,下载并安装RL-Glue Core和RL-Glue Matlab编解码器。 a)最好从2014 RL竞赛网站()下载直升机环境, b)如果其他链接不可用,请从RL图书馆网站()下载。 将helicopter文件夹复制到pilco_root/scenarios/文件夹中。 将GPAgentMatlab和randomAgentMatlab文件夹复制到helicopter/agents/文件夹中(在步骤2a中创建)。 将testTrainerJavaHelicopter和consoleTrainerJavaHelicopter复制到/helic
2022-04-22 14:31:23 1.06MB 系统开源
1
文章链接:https://blog.csdn.net/shoppingend/article/details/124297444?spm=1001.2014.3001.5502
2022-04-21 17:06:44 4KB 算法
1
根据泛函达到极值的必要条件 则有: (1.3.7) 式(1.3.7)左边第一项相当于tf固定时的泛函的变分,按照上一节推导的结果可得 (1.3.8)
2022-04-21 09:54:28 1015KB 变分法 最优控制
1
对三次样条插值函数的m文件,下载可直接可用,用于matlab编程设计和课程作用 对三次样条插值函数的m文件,下载可直接可用,用于matlab编程设计和课程作用
2022-04-21 00:25:17 736B matlab 三次样条
1
文章链接:https://blog.csdn.net/shoppingend/article/details/124291112?spm=1001.2014.3001.5501
2022-04-20 18:08:35 3KB 算法
1
神经网络解决马尔可夫决策问题思路,理解强化学习的先导
概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mbpo.py --env_name'Walker2d-v2'--num_epoch 300 --model_type'pytorch' python main_mbpo.py --env_name'Hopper-v2'--num_epoch 300 --model_type'pytorch' 参考
2022-04-20 11:15:37 172KB Python
1
强化学习有关的教材,涉及理论方面的推导和证明,有助于理解强化学习的代码,需要的可以下载!!!
2022-04-19 21:23:22 10.01MB ai
1
资源包含相关研究文献及对应的maltab仿真程序,仅供参考。 针对三自由度欠驱动船舶的路径跟踪问题,本文提出一种基于强化学习的自适应迭代滑模控制方法。该方法引入双曲正切函数对系统状态进行迭代滑模设计,并采用神经网络对控制参数进行优化,增强控制器的自适应性。通过定义一种控制量抖振测量变量和强化学习信号,实现对神经网络的结构和参数进行在线调整,能进一步抑制控制量的抖振作用。应用5446TEU集装箱船的数学模型进行控制仿真,结果表明所设计控制器能有效地处理风和流等外界扰动,具有较强的鲁棒性,与迭代滑模控制器相比舵角的抖振减小明显,控制舵角信号符合船舶的实际操作要求,更符合工程实际要求。
2022-04-19 15:07:39 293KB 神经网络 机器学习 人工智能
资源包含相关参考文献及对应的matlab仿真程序,仅供参考。 针对欠驱动船舶的路径跟踪问题,提出一种基于强化学习的自适应迭代滑模控制方法。该方法引入双曲正切函数对系统状态进行迭代滑模设计,并采用神经网络对控制参数进行优化,增强控制器的自适应性。通过定义一种控制量抖振测量变量和强化学习信号,实现对神经网络的参数进行在线调整,能进一步抑制控制量的抖振作用。其次,针对欠驱动船舶的轨迹跟踪问题,把设计的基于强化学习的迭代滑模控制器推广到两路控制,对跟踪轨迹的横向和纵向偏差分别进行迭代滑模控制器设计,控制器输出为控制舵角和柴油机转速,根据舵角和转速抖振实现参数调节,控制器的控制结构与路径跟踪控制类似。
2022-04-19 15:07:38 4.61MB 机器学习 深度学习 迭代学习